1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

51 503 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 51
Dung lượng 4,8 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài toán phá hiện mặt người được bắt đầu nghiên cứu từ những năm 1990, và đã córất nhiều công trình nghiên cứu về phát hiện khuôn mặt trong ảnh, tuy nhiên cho đến nay,các nhà khoa học vẫ

Trang 1

MỤC LỤC

MỤC LỤC 1

Danh mỤc các hình vẼ 3

Danh mỤc các bẢng biỂu 3

LỜi cẢm ơn 4

MỞ đẦu 5

CHƯƠNG 1 BÀI TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ 7

1.1 Giới thiệu về bài toán xác định mặt người trong ảnh số 7

1.2 Những khó khăn và thách thức đối với bài toán xác định mặt người 7

1.3 Các ứng dụng của xác định mặt người 8

1.4 Xác định phạm vi đề tài 9

CHƯƠNG 2 CÁC KỸ THUẬT XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ 10

2.1 Hướng tiếp cận dựa trên tri thức 10

2.1.1 Tư tưởng của tiếp cận dựa trên tri thức 10

2.1.2 Các nghiên cứu liên quan 11

2.2 Hướng tiếp cận dựa trên đặc trưng không thay đổi 13

2.2.1 Các đặc trưng của khuôn mặt 13

2.2.3 Kết cấu của khuôn mặt 15

2.2.4 Mầu sắc da 15

2.2.5 Đa đặc trưng 15

2.3 Hướng tiếp cận dựa trên so sánh khớp mẫu 15

2.3.1 Tư tưởng của so sánh khớp mẫu 15

2.3.2 Xác định các mẫu 15

2.3.3 Các mẫu biến dạng 17

CHƯƠNG 3: THUẬT TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ DỰA TRÊN KỸ THUẬT NHẬN BIẾT MÀU DA 19

3.1 Các kỹ thuật nhận biết màu da dựa trên tính chất điểm ảnh 19

3.1.1 Không gian màu sử dụng cho mô hình hóa màu da 20

3.1.1.1 Không gian màu RGB 20

3.1.1.2 Không gian RGB chuẩn hóa 20

3.1.1.3 HIS, HSV, HSL - Độ bão hòa của màu 21

3.1.1.4 TSL – Tint, Saturation, Lightness (sắc thái, độ bão hòa, độ dịu ) 21

3.1.1.5 YcrCb 22

3.1.1.6 Các hệ tọa độ không gian màu khác 22

Trang 2

3.1.2 Mô hình hóa màu da 22

3.1.2.1 Xác định ngưỡng cụ thể một điểm ảnh là màu da 23

3.1.2.2 Phương pháp mô hình hóa màu da sử dụng phân phối không tham số 23 3.1.2.3 Mô hình hóa phân phố màu da có tham số 25

3.1.3 So sánh và đánh giá các mô hình 27

3.2 Đề xuất thuật toán xác định ảnh màu dựa trên màu da 29

3.2.1 Định vị vùng khuôn mặt người trong ảnh màu 29

3.2.2 Giai đoạn tiền xử lý hình ảnh ban đầu 32

3.2.2.1 Định nghĩa của một khuôn mặt người 34

3.2.2.2 Thuật toán để xác định khuôn mặt dựa trên kỹ thuật mặt nạ 34

3.2.2.3 Xác định tọa độ của trung tâm của khuôn mặt 35

3.3 Kết quả thực nghiệm và đánh giá 42

KẾT LUẬN 45

TÀI LIỆU THAM KHẢO 49

Trang 3

DANH MỤC CÁC HÌNH VẼ

Hình 2.1: Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down .11

Hình 2.2: Phương pháp chiếu: 12

Hình 2.3: Một mẫu khuôn mặt có kích thước 14 x 16 pixel được sử dụng trong phương pháp định vị khuôn mặt của Sinha Mẫu gồm 16 vùng trên khuôn mặt và 23 quan hệ ( các mũi tên) 17

Hình 3.1 Màu sắc hình ảnh và các thành phần R, G và B 29

Hình 3.2 Các thành phần của ảnh gốc trong không gian màu HSV, YCbCr và I1I2I3 30

Hình 3.3 Tiền xử lý hình ảnh ban đầu tại đầu vào hệ thống 33

Hình 3.4 Bản gốc hình ảnh tại đầu vào phát hiện và mặt nạ thích hợp xác định các khu vực của mặt người 35

Hình 3.5 Định nghĩa trung tâm của khuôn mặt 36

Hình 3.6 Ví dụ 1 về phân lớp của khuôn mặt 37

Hình 3.7 Ví dụ 2 về phân lập của khuôn mặt 37

Hình 3.8 Các phân tích của khuôn mặt và tiền xử lý mới 38

Hình 3.9a Các bước để xác định tọa độ của mắt trung tâm 38

Hình 3.9b Căn chỉnh của khuôn mặt theo yêu cầu 39

Hình 3.10 Cấu trúc hệ thống xác định và chuẩn hóa mặt người 40

Hình 3.11 Khuôn mặt trong cơ sở dữ liệu FERET 42

Hình 3.12 Kết quả phát hiện mặt người trong cơ sở dữ liệu FERET COLOR 43

Hình 3.13 Kết quả phát hiện mặt người trong cơ sở dữ liệu CAMERA 44

DANH MỤC CÁC BẢNG BIỂU Bảng 3.1 Kết quả nhận biết đúng và sai của các phương pháp 28

Trang 4

LỜI CẢM ƠN

Đầu tiên, em xin gửi lời cảm ơn sâu sắc nhất đến cán bộ hướng dẫn khoa học, thầygiáo, TS Vũ Duy Linh, người đã truyền cho em nguồn cảm hứng nghiên cứu khoa học,người đã định hướng cho em đến với lĩnh vực nghiên cứu này

Em xin bày tỏ lời cảm ơn tới các thầy giáo, cô giáo đã giảng dạy em trong suốt hainăm học qua Em cũng muốn gửi lời cảm ơn tới những thành viên lớp đã có những góp ýchuyên môn cũng như sự động viên về tinh thần rất đáng trân trọng

Em xin ghi nhận những tình cảm, sự giúp đỡ về chuyên môn của các thầy giáo trong

Bộ môn Khoa học máy tính, Khoa Công nghệ thông tin, Trường Đại học Thái Nguyên Sựquan tâm của các thầy cô đã động viên và khích lệ em rất nhiều trong thời gian qua

Cuối cùng, em xin gửi lời cảm ơn sâu sắc tới tất cả người thân trong gia đình vànhững bạn bè em với những động viên dành cho em trong công việc và trong cuộc sống

Học viên thực hiện luận văn

Lê Thị Phương Anh

Trang 5

MỞ ĐẦU

Công nghệ thông tin đã và đang được ứng dụng rộng rãi trong mọi lĩnh vực của cuộcsống Với một hệ thống máy tính, chúng ta có thể làm được rất nhiều việc từ đơn giản đếnphức tạp Máy tính giúp con người tiết kiện thời gian và công sức khi xử lý các công việctrong thực tế Điển hình như công việc nhận dạng mặt người Trước đây, khi muốn tìmkiếm một kẻ tình nghi trong siêu thị hay sân bay, các nhân viên an ninh phải tìm kiếm trêntừng màn hình của các camera theo dõi Ngày nay, công việc đấy đã được làm tự động nhờcác hệ thống nhận dạng mặt người Phát hiện mặt người trong ảnh là một phần quan trọngcủa hệ thống nhận dạng đó Nếu giải quyết tốt việc phát hiện mặt người sẽ giúp chúng tatiết kiệm thời gian và nâng cao độ chính xác của việc nhận dạng khuôn mặt

Phát hiện mặt người cũng là một bài toán nhận dạng đơn giản, hệ thống chỉ cần phânloại đối tượng đưa vào có phải mặt người hay không phải mặt người Ở mức độ cao hơn,sau khi đã phát hiện được khuôn mặt, các khuôn mặt đó sẽ được so sánh với các khuônmặt có trong dữ liệu để nhận dạng xem khuôn mặt đấy là của ai (thường áp dụng trongnhận dạng khuôn mặt của người nổi tiếng hoặc của tội phạm đang bị truy nã)

Bài toán phá hiện mặt người được bắt đầu nghiên cứu từ những năm 1990, và đã córất nhiều công trình nghiên cứu về phát hiện khuôn mặt trong ảnh, tuy nhiên cho đến nay,các nhà khoa học vẫn không ngừng tìm các hướng tiếp cận mới, các thuật toán mới nhằmnâng cao hiệu suất của việc phát hiện khuôn mặt cũng như việc nhận dạng mặt người.Với mục tiêu chính là tìm hiểu, phân tích các thuật toán phát hiện mặt người hiện nay

và đưa ra cách tiếp cận mới để áp dụng vào bài toán phát hiện mặt người trong ảnh, luậnvăn được trình bày trong 3 chương với bố cục như sau:

Chương 1: Bài toán xác định mặt người trong ảnh số Giới thiệu tổng quan về bài

toán xác định mặt người trong ảnh, các ứng dụng và những khó khăn của bài toán

Chương 2: Các kỹ thuật xác định mặt người trong ảnh số Phân tích các kỹ thuật

xác định mặt người trong ảnh số

Trang 6

Chương 3: Thuật toán xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da Tập chung phân tích kỹ thuật phát hiện mặt người dựa trên đặc trưng màu

da Từ đó đề xuất thuật toán xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biếtmàu da và thực nghiệm

Cuối cùng là kết luận và hướng phát triển: Tóm tắt những kết quả đạt được, những

hạn chế và nêu lên các hướng phát triển trong tương lai

Trang 7

CHƯƠNG 1 BÀI TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ

1.1 Giới thiệu về bài toán xác định mặt người trong ảnh số

Trong những năm qua, có rất nhiều công trình nghiên cứu về bài toán nhận dạng mặtngười Các nghiên cứu đi từ bài toán đơn giản, từ việc nhận dạng một mặt người trong ảnhđen trắng cho đến mở rộng cho ảnh mầu và có nhiều mặt người trong ảnh Đến nay các bàitoán xác định mặt người đã mở rộng với nhiều miền nghiên cứu như nhận dạng khuônmặt, định vị khuôn mặt, xác định trạng thái mắt người, theo dõi mặt người hay nhận dạngcảm xúc mặt người…

Phát hiện mặt người trong ảnh là phần đầu tiên của một hệ thống nhận dạng mặtngười Các hệ thống nhận dạng khuôn mặt được bắt đầu xây dựng từ những năm 1970, tuynhiên do còn hạn chế về các luật xác định mặt người nên chỉ được áp dụng trong một sốứng dụng như nhận dạng thẻ căn cước Nó chỉ được phát triển mạnh mẽ từ những năm

1990 khi có những tiến bộ trong công nghệ video và ngày nay thì các ứng dụng của xácđịnh mặt người đã trở nên phổ biến trong cuộc sống [1]

Định nghĩa bài toán xác định mặt người: Xác định khuôn mặt người là một kỹ thuậtmáy tính để xác định các vị trí và kích thước của các khuôn mặt người trong các ảnh số bất

kì Kỹ thuật này nhận biết các đặc trưng của khuôn mặt và bỏ qua những thứ khác xungquanh đối tượng như: tòa nhà, cây cối, cơ thể…

1.2 Những khó khăn và thách thức đối với bài toán xác định mặt người.

Việc xác định khuôn mặt người có những khó khăn nhất định như:

- Hướng (pose) của khuôn mặt đối với máy ảnh, như: nhìn thẳng, nhìn

nghiêng hay nhìn từ trên xuống Cùng trong một ảnh có thể có nhiều khuônmặt ở những tư thế khác nhau

- Sự có mặt của các chi tiết không phải là đặc trưng riêng của khuôn mặtngười, như: râu quai nón, mắt kính, …

- Các nét mặt (facial expression) khác nhau trên khuôn mặt, như: vui, buồn,

ngạc nhiên, …

Trang 8

- Mặt người bị che khuất bởi các đối tượng khác có trong ảnh.

- Sự biểu cảm của khuôn mặt: sự biểu cảm có thể làm thay đổi đáng kể cácđặc trưng và thông số của khuôn mặt, ví dụ như khuôn mặt của cùng mộtngười sẽ rất khác khi người đấy cười, tức giận hay sợ hãi …

1.3 Các ứng dụng của xác định mặt người

Xác định mặt người thường là một phần của một hệ thống (facial recognition system)

[2] Nó thường được dùng trong giám sát video, giao tiếp người máy và quản lý cơ sở dữliệu ảnh…

Các ứng cơ bản của xác định mặt người có thể kể đến là:

- Xác minh tội phạm: Dựa vào ảnh của một người, nhận dạng xem người đấy có

phải là tội phạm hay không bằng cách so sách với các ảnh tội phạm đang đượclưu trữ Hoặc có thể sử dụng camera để phát hiện tội phạm trong đám đông.Ứng dụng này giúp cơ quan an ninh quản lý con người tốt hơn

- Camera chống trộm: Các hệ thống camera sẽ xác định đâu là con người và theo

dõi xem con người đó có làm gì phạm pháp không, ví dụ như lấy trộm đồ, xâmnhập bất hợp pháp vào một khu vực nào đó

- Bảo mật: Các ứng dụng về bảo mật rất đa dạng, một trong số đó là công nghệ

nhận dạng mặt người của laptop, công nghệ này cho phép chủ nhân của máytính chỉ cần ngồi trước máy là có thể đăng nhập được Để sử dụng công nghệnày, người dùng phải sử dụng một webcam để chụp ảnh khuôn mặt của mình vàcho máy “học” thuộc các đặc điểm của khuôn mặt giúp cho quá trình đăng nhậpsau này

- Lưu trữ khuôn mặt: Xác định mặt người có thể được ứng dụng trong các trạm

rút tiền tự động (ATM) để lưu trữ khuôn mặt của người rút tiền Hiện nay cónhững người bị người khác lấy trộm thẻ ATM và mã PIN, và bị rút tiền trộm,hoặc có những chủ tài khoản đi rút tiền nhưng lại báo với ngân hàng là bị mấtthẻ và bị rút tiền trộm Nếu lưu trữ được khuôn mặt của người rút tiền, ngânhàng có thể đối chứng và xử lý dễ dàng hơn

Các ứng dụng khác:

Trang 9

- Điều khiển vào ra: văn phòng, công ty, trụ sở, máy tính, Palm,…Kết hợp thêm

vân tay và mống mắt Cho phép nhân viên được ra vào nơi cần thiết

- An ninh sân bay, xuất nhập cảnh (hiện nay cơ quan xuất nhập cảnh Mỹ đã áp

dụng ) Dùng camera quan sát để xác thực người nhập cảnh và kiểm tra xemngười đấy có phải là tội phạm hay phần tử khủng bố không

- Tìm kiếm và tổ chức dữ liệu liên quan đến con người thông qua khuôn mặtngười trên nhiều hệ cơ sở dữ liệu lưu trữ thật lớn, như internet, các hãng truyềnhình,…Ví dụ: tìm các đoạn video có tổng thống Obama phát biểu, tìm các phim

có diễn viên Thành Long đóng…

- Kiểm tra trạng thái người lái xe có ngủ gật, mất tập trung hay không, và hỗ trợthông báo khi cần thiết

- Tương lai sẽ phát triển các loại thẻ thông minh có tích hợp sẵn đặc trưng củangười dùng trên đó, khi bất cứ người dùng khác dùng để truy cập hay xử lý tạicác hệ thống sẽ được yêu cầu kiểm tra các đặc trưng khuôn mặt so với thẻ đểbiết nay có phải là chủ thẻ hay không

- Hãng máy chụp hình Canon đã ứng dụng bài toán xác định khuôn mặt ngườivào máy chụp hình thế hệ mới để cho kết quả hình ảnh đẹp hơn, nhất là khuônmặt người

1.4 Xác định phạm vi đề tài

Trong đề tài này, tôi tập trung vào việc xác định khuôn mặt trong ảnh dựa trên nhậnbiết màu da Từ đấy lưu khuôn mặt tìm được vào cơ sử dữ liệu để phục vụ cho các mụcđích khác (chẳng hạn như nhận dạng mặt người hoặc ghép khuôn mặt vào bức ảnhkhác…) Do các điều kiện khó khăn đã nêu ở trên tôi xin đưa ra những giả định và ràngbuộc sau để giảm độ phức tạp của bài toán:

- Các khuôn mặt được chụp thẳng hoặc góc nghiêng không đáng kể (nhỏ hơnhoặc bằng 10o)

- Phông nền của ảnh không quá phức tạp

- Ảnh được chụp trong điều kiện ánh sáng bình thường

Trang 10

CHƯƠNG 2 CÁC KỸ THUẬT XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ

Dựa vào tính chất của các phương pháp xác định mặt người trên ảnh, các phươngpháp này được chia thành bốn loại chính, tương ứng với bốn hướng tiếp cận khác nhau.Ngoài ra cũng có rất nhiều nghiên cứu mà phương pháp xác định mặt người không chỉ dựavào một hướng mà có liên quan đến nhiều hướng

- Hướng tiếp cận dựa trên tri thức: Dựa vào các thuật toán, mã hóa các đặc trưng

và quan hệ giữa các đặc trưng của khuôn mặt thành các luật Đây là hướng tiếpcận theo kiểu top-down

- Hướng tiếp cận dựa trên đặc trưng không thay đổi: Xây dựng các thuật toán để

tìm các đặc trưng của khuôn mặt mà các đặc trưng này không thay đổi khi tư thếkhuôn mặt hay vị trí đặt camera thay đổi

- Hướng tiếp cận dựa trên so sánh khớp mẫu: Dùng các mẫu chuẩn của khuôn

mặt (các mẫu này đã được chọn và lưu trữ) để mô tả các khuôn mặt hay các đặctrưng của khuôn mặt (các mẫu này được chọn tách biệt theo tiêu chuẩn đã đượccác tác giả đề ra để so sánh) Phương pháp này có thể dùng để xác định vị tríhay dò tìm khuôn mặt trên ảnh

- Hướng tiếp cận dựa trên diện mạo: Trái ngược với hướng tiếp cận dựa trên

khuôn mẫu, các mô hình (hay các mẫu) sẽ được học từ một tập ảnh huấn luyện

mà thể hiện tính chất tiêu biểu của sự xuất hiện của mặt người trong ảnh Sau đó

hệ thống (mô hình) sẽ xác định mặt người Phương pháp này còn được biết đếnvới tên gọi tiếp cận theo các phương pháp học máy

2.1 Hướng tiếp cận dựa trên tri thức

2.1.1 Tư tưởng của tiếp cận dựa trên tri thức

Trong hướng tiếp cận này, các phương pháp xác định mặt người được xây dựng dựavào các luật, các luật này phụ thuộc vào tri thức của các tác giả nghiên cứu về bài toán xácđịnh khuôn mặt Dễ dàng xây dựng các luật cơ bản để mô tả các đặc trưng của khuôn mặt

và các quan hệ tương ứng Ví dụ, một khuôn mặt thường có hai mắt đối xứng qua trục

Trang 11

thẳng đứng giữa khuôn mặt và có một mũi một miệng Các quan hệ đặc trưng có thể làquan hệ về vị trí và khoảng cách tương đối Khó khăn của hướng tiếp cận này đó là làmthế nào để chuyển các tri thức của con người về khuôn mặt sang các luật cho máy tính mộtcách hiệu quả Nếu các luật này quá chi tiết, chặt chẽ thì sẽ có thể xác định thiếu cáckhuôn mặt có trong ảnh, nhưng nếu các luật quá tổng quát thì sẽ dẫn đến xác định sai khuvực không phải là khuôn mặt thành khuôn mặt Ngoài ra cũng khó để mở rộng phạm vicủa bải toán để xác định các khuôn mặt có nhiều tư thế khác nhau.

2.1.2 Các nghiên cứu liên quan

Có nhiều cách để xây dựng chương trình xác định mặt người theo hướng tiếp cận dựatrên tri thức Thông thường chương trình sẽ được xây dựng theo hướng dựa vào mộtphương pháp nào đấy chọn ra các ứng viên trong bức ảnh trước, sau đó sẽ áp dụng các luật

để xác định ứng viên nào là khuôn mặt, ứng viên nào không phải là khuôn mặt Quá trìnhnày có thể được áp dụng nhiều lần để giảm sai sót Các luật được xây dựng dựa vào trithức của người nghiên cứu về các đặc trưng của khuôn mặt (ví dụ như cường độ phân

phôi và sự khác nhau ) của các vùng trên khuôn mặt

Hình 2.1: Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down

Yang và Huang đã sử dụng hướng tiếp cận dựa trên tri thức để xác định khuôn mặt[3-4] Hệ thống của hai tác giả bao gồm ba mức luật Đầu tiên các ông sử dụng một khungcửa sổ để quét trên bức ảnh và thông qua một số tập luật để xác định các ứng viên có thể làmặt người, ví dụ như tìm phần trung tâm của khuôn mặt (phần tối hơn trong hình 2.1).Tiếp theo, dùng một tập luật để mô tả tổng quát hình dáng khuôn mặt, lọc các ứng viên ởmức một thành một tập các ứng viên mới có xác xuất là khuôn mặt cao hơn Cuối cùng,các ông lại dùng một tập luật khác để xem xét ở mức chi tiết các đặc trưng khuôn mặt (cóthể là đặc trưng về mắt, mũi, miệng…), từ đó lọc ra các ứng viên chính xác nhất Có thể

Trang 12

nói cách làm của hai ông là một cách làm mịn dần để đạt được kết quả tốt nhất, mặc dù tỷ

lệ chính xác chưa cao, nhưng đây là tiền đề cho nhiều nghiên cứu sau này

Có rất nhiều công trình nghiên cứu sử dụng phương pháp chiếu để xác định khuônmặt Kotropoulos và Pitas [5] đưa ra một phương pháp gần tương tự với Yang và Huang.Đầu tiên, các vùng của khuôn mặt được định vị bởi phương pháp chiếu (đã được Kanade

sử dụng thành công) để xác định biên của khuôn mặt Với I(x,y) là giá trị xám của một

điểm trong ảnh có kích thước m x n ở tại vị trí (x,y), các hàm để chiếu ảnh theo phươngngang và thẳng đứng được định nghĩa như sau:

ta các vị trí của miệng, đỉnh mũi và hai mắt Các đặc trưng này đủ để xác định khuôn mặt.Hình 2.2.a cho một ví dụ về cách xác định như trên Cách xác định này có tỷ lệ xác địnhchính xác là 86.5% cho trường hợp chỉ có một khuôn mặt thẳng trong ảnh và hình nềnkhông phức tạp Nếu hình nền phức tạp như hình 2.2.b thì rất khó tìm Còn nếu ảnh cónhiều khuôn mặt (hình 2.2.c) thì sẽ không xác định được

Hình 2.2: Phương pháp chiếu: (a) Ảnh chỉ có một khuôn mặt và hình nền đơn giản;

(b) Ảnh chỉ có một khuôn mặt và hình nền phức tạp;

(c) Ảnh có nhiều khuôn mặt

Trang 13

2.2 Hướng tiếp cận dựa trên đặc trưng không thay đổi

Tiếp cận dựa trên các đặc trưng không thay đổi là tiếp cận theo kiểu Bottom-Up Dựatrên thực tế, chúng ta cố gắng tìm ra những đặc điểm không thay đổi khi của khuôn mặtkhi ở các tư thế khác nhau và các điều kiện môi trường như ánh sáng khác nhau Đã có rấtnhiều nghiên cứu về hướng tiếp cận này, các đặc điểm không thay đổi được tìm thấy nhưlông mày, mắt, mũi, miệng hay các đường viền trên tóc… Trên cơ sở các đặc trưng này,các nhà nghiên cứu xây dựng lên một mô hình thống kê mô tả quan hệ của các đặc trưng

và từ đó xác định sự xuất hiện của khuôn mặt trong bức ảnh Khó khăn của hướng tiếp cậnnày đó là phải mô tả các đặc trưng không thay đổi và quan hệ giữa chúng phù hợp với điềukiện ánh sáng, độ nhiễu hay bị che khuất

2.2.1 Các đặc trưng của khuôn mặt

Có rất nhiều nghiên cứu về các đặc trưng của khuôn mặt Có thể dựa vào các đặctrưng như hai mắt, hai lỗ mũi, miệng, phần nối giữa mũi và miệng…hoặc dựa vào đườngviền của khuôn mặt

Leung trong [6] đã đề xuất mô hình xác xuất để xác định khuôn mặt trong ảnh cóhình nền phức tạp dựa trên việc tìm kiếm các đặc trưng không thay đổi của khuôn mặttrong ảnh, sau đó dùng đồ thị ngẫu nhiên để xác định khuôn mặt Tư tưởng của phươngpháp này đó là xem bài toán xác định khuôn mặt như là bài toán tìm kiếm với mục tiêu làtìm thứ tự các đặc trưng không thay đổi của khuôn mặt Dùng năm đặc trưng (hai mắt, hai

lỗ mũi, phần nối giữa mũi và miệng) để mô tả một khuôn mặt Đồng thời tính quan hệkhoảng cách cho tất cả các cặp đặc trưng (như mắt trái, mắt phải), sau đấy dùng phân bốGauss để mô hình hóa Một mẫu khuôn mặt được đưa ra thông qua trung bình tương ứngcho một tập đa hướng, đa tỷ lệ của bộ lọc đạo hàm Gauss Từ một ảnh, các đặc trưng củaứng viên được xác định bằng cách so khớp từng điểm ảnh khi lọc tương ứng với vectormẫu Hai ứng viên có đặc trưng đứng đầu sẽ được chọn để tìm kiếm cho các đặc trưngkhác của khuôn mặt Từ các đặc trưng không thay đổi, các đặc trưng khác sẽ được xácđịnh thông qua sự đánh giá xác xuất khoảng cách giữa các đặc trưng, hơn nữa phương saicủa phép thống kê này có thể được tính toán trước để xác định các đặc trưng với xác xuấtlớn Tỷ lệ chính xác của phương pháp này là 86%

Bên cạnh tính khoảng cách liên quan để mô tả quan hệ giữa các đặc trưng như LeungKendall [6], Mardia và Dryden [7] dùng lý thuyết xác suất thống kê về hình dáng Dùng

Trang 14

hàm mật độ xác suất (Probility Density Function - PDF) qua N điểm đặc trưng, tương ứng (x i , y i ) là đặc trưng thứ i với giả sử là phân bố Gauss có 2N-chiều Các tác giả áp dụng phương thức cực đại khả năng (Maximum-Likelihood - ML) để xác định vị trí khuôn mặt.

Một thuận lợi của phương pháp này là các khuôn mặt bị che khuất vẫn có thể xác địnhđược Hạn chế phương pháp này đó là không xác định được nhiều khuôn mặt trong cùngmột ảnh

Không dùng phương pháp xác suất, Sirohey đưa một phương pháp khác xác địnhkhuôn mặt từ một ảnh có hình nền phức tạp dựa trên cạnh [8] Dùng phương pháp Candy[9] và heuristics loại bỏ các cạnh để còn lại duy nhất một đường bao xung quanh khuônmặt Một hình ellipse dùng để bao khuôn mặt, tách biệt vùng đầu và hình nền Tỷ lệ chínhxác của thuật toán là 80%

Graf đưa ra một phương pháp xác định đặc trưng rồi xác định khuôn mặt trong ảnh

xám [10] Dùng bộ lọc để làm nổi các biên, các phép toán hình thái học (morphology)

được dùng để làm nổi bật các vùng có cường độ cao và hình dáng chắc chắn (như mắt).Thông qua histogram để tìm các đỉnh nổi bật để xác định các ngưỡng chuyển ảnh xámthành hai ảnh nhị phân Các thành phần dính nhau đều xuất hiện trong hai ảnh nhị phânthì được xem là vùng của ứng viên khuôn mặt rồi phân loại xem có phải là khuôn mặtkhông Phương pháp được kiểm tra trên các ảnh chỉ có đầu và vai của người Tuy nhiênphương pháp này còn một vấn đề đấy là sử dụng các phép toán morphology như thế nào

và làm sao xác định khuôn mặt trên các vùng ứng viên

Trong [11], Girosi dùng Gaze để tìm ứng viên góc mắt, miệng và tâm mắt Ông xây

dựng SVM (Support Vector Machine) đã được học trước đó để xác định các vị trí ứng viên

có phải là góc mắt, miệng, và tâm mắt hay không để theo vết con mắt người Juan vàNarciso xây dựng một không gian màu mới YCg’Cr’ để lọc các vùng là ứng viên khuônmặt dựa trên sắc thái của màu da người Sau khi có ứng viên, hai ông dùng các quan hệ vềhình dáng khuôn mặt, mức độ cân đối của các thành phần khuôn mặt để xác định khuônmặt người

Tương tự, Chang và Hwang cũng dùng không gian màu Ycg’Cr’ với tỷ lệ chính xáchơn 80% trong ảnh xám Jin xây dựng một bộ lọc để xác định ứng viên khuôn mặt ngườitheo màu da người Từ ứng viên này tác giả xác định khuôn mặt người theo hình dáng

Trang 15

khuôn mặt và các quan hệ đặc trưng về thành phần khuôn mặt, với mắt phải được chọnlàm gốc tọa độ để xét quan hệ Tỷ lệ chính xác cho khuôn mặt chụp thẳng trên 80%.

2.2.3 Kết cấu của khuôn mặt.

Khuôn mặt con người có những kết cấu riêng biệt mà có thể dùng để phân loại so vớicác đối tượng khác Từ kết cấu của khuôn mặt xây dựng lên một bộ phân loại, gọi là kết

cấu giống khuôn mặt (face-like texture).

2.2.4 Mầu sắc da

Thông thường các ảnh màu không xác định trực tiếp trên toàn bộ dữ liệu ảnh mà cáctác giả dùng tính chất sắc màu của da người (khuôn mặt người) để chọn ra được các ứngviên có thể là khuôn mặt người (lúc này dữ liệu đã thu hẹp đáng kể) để xác định khuônmặt người

2.2.5 Đa đặc trưng

Gần đây có nhiều nghiên cứu sử dụng các đặc trưng toàn cục như: màu da người,kích thước, và hình dáng để tìm các ứng viên khuôn mặt, rồi sau đó sẽ xác định ứng viênnào là khuôn mặt thông qua dùng các đặc trưng cục bộ (chi tiết) như: mắt, lông mày, mũi,miệng, và tóc Tùy mỗi tác giả sẽ sử dụng tập đặc trưng khác nhau

2.3 Hướng tiếp cận dựa trên so sánh khớp mẫu.

2.3.1 Tư tưởng của so sánh khớp mẫu

Trong hướng tiếp cận dựa trên so sánh khớp mẫu, các mẫu chuẩn của khuôn mặt(thường là khuôn mặt được chụp thẳng) sẽ được xác định trước hoặc được biểu diễn thànhmột hàm với các tham số cụ thể Từ một ảnh đưa vào, tính các giá trị tương quan so vớicác mẫu chuẩn về đường viền khuôn mặt, mắt, mũi và miệng Thông qua các giá trị tươngquan này mà hệ thống sẽ quyết định có hay không có tồn tại khuôn mặt trong ảnh Hướngtiếp cận này có lợi thế là rất dễ cài đặt, nhưng không hiệu quả khi tỷ lệ, tư thế, và hìnhdáng thay đổi

2.3.2 Xác định các mẫu

Sakai đã cố gắng thử xác định khuôn mặt người chụp thẳng trong ảnh [12] Tác giả

dùng vài mẫu con (sub template) về mắt, mũi, miệng, và đường viền khuôn mặt để mô

hình hóa một khuôn mặt Mỗi mẫu con được định nghĩa trong giới hạn của các đoạn thẳng.Các đường thẳng trong ảnh được trích bằng cách xem xét thay đổi của hệ số góc và so

Trang 16

khớp các mẫu con Đầu tiên tìm các ứng viên thông qua mối tương quan giữa các ảnh con

và các mẫu về đường viền Sau đó, so khớp với các mẫu con khác Hay nói một cách khác,giai đoạn đầu xem như là giai đoạn sơ chế để tìm ứng viên, giai đọan thứ hai là giai đoạntinh chế để xác định ứng viên có phải là khuôn mặt hay không Ý tưởng này được duy trìcho đến các nghiên cứu sau này

Craw đưa ra một phương pháp xác định khuôn mặt người dựa vào các mẫu về hìnhdáng của các ảnh được chụp thẳng (dùng vẻ bề ngoài của hình dáng khuôn mặt) Đầu tiêndùng phép lọc Sobel (Phép lọc Sobel dựa vào tích vô hướng của hai vector gradient) đểtìm các cạnh Các cạnh này sẽ được nhóm lại theo một số ràng buộc Sau đó, tìm đườngviền của đầu, quá trình tương tự được lặp đi lặp lại với mỗi tỷ lệ khác nhau để xác địnhcác đặc trưng khác như: mắt, lông mày, và môi Sau đó Craw mô tả một phương thức xácđịnh dùng một tập có 40 mẫu để tìm các đặc trưng khuôn mặt và điều khiển chiến lược

dò tìm [13]

Một số nhà nghiên cứu sử dụng hình chiếu như các mẫu để xác định khuôn mặt

người Silhouettes dùng PCA (Phân tích thành phần chính-Principal Component Analysis)

để có một tập hình chiếu cơ bản từ các mẫu khuôn mặt, hình chiếu được mô tả như mộtmảng các bit Dùng đặc trưng hình chiếu riêng kết hợp biến đổi Hough để xác định khuônmặt người Sau đó một phương pháp xác định dựa trên đa loại mẫu để xác định các thànhphần của khuôn mặt được trình bày Phương pháp này định nghĩa một số giả thuyết để mô

tả các khả năng của các đặc trưng khuôn mặt Với một khuôn mặt sẽ có một tập giả thuyết,

lý thuyết DepsterShafer Dùng một nhân tố tin cậy để kiểm tra sự tồn tại hay không củacác đặc trưng của khuôn mặt, và kết hợp nhân tố tin cậy này với một độ đo để xem xét cóhay không có khuôn mặt trong ảnh

Sinha dùng một tập nhỏ các ảnh bất biến trong không gian ảnh để mô tả không giancác mẫu ảnh [15-16] Tư tưởng chính của ông dựa vào sự thay đổi mức độ sáng của cácvùng khác nhau của khuôn mặt (như hai mắt, hai má, và trán), (quan hệ về mức độ sángcủa các vùng còn lại thay đổi không đáng kể) Sau đấy xác định các cặp tỷ số của mức độsáng của một số vùng (một vùng tối hơn hay sáng hơn) cho ta một lượng bất biến khá hiệuquả Ông lưu sự thay đổi độ sáng của các vùng trên khuôn mặt trong một tập thích hợp vớicác cặp quan hệ sáng hơn – tối hơn giữa các vùng nhỏ Một khuôn mặt được xác định nếu

nó thỏa mãn tất cả các cặp sáng hơn – tối hơn Ý tưởng này xuất phát từ sự khác biệt của

Trang 17

cường độ giữa các vùng kề cục bộ trên ảnh, sau này nó được mở rộng trên cơ sở biến đổiwavelet để xác định người đi bộ, xác định xe hơi, xác định khuôn mặt Ý tưởng của Sinhacòn được áp dụng trong các nghiên cứu về thị giác của robot

Hình 2.3: Một mẫu khuôn mặt có kích thước 14 x 16 pixel được sử dụng trong phương pháp định

vị khuôn mặt của Sinha Mẫu gồm 16 vùng trên khuôn mặt và 23 quan hệ ( các mũi tên).

Hình 2.3 cho thấy mẫu khuôn mặt với 16 cùng và 23 quan hệ Các quan hệ này đượcdùng để phân loại, có 11 quan hệ thiết yếu (các mũi tên màu đen) và 12 quan hệ xác thực(các mũi tên mầu xám) Mỗi mũi tên là một quan hệ Một quan hệ của hai vùng thỏa mãnmẫu khuôn mặt khi tỷ lệ giữa hai vùng vượt qua một ngưỡng và một khuôn mặt được xácđinh khi có 23 quan hệ thỏa mãn điều kiện trên Một số phương pháp khác như của Froba

và Zink lọc cạnh ở độ phân giải thấp rồi dùng biến đổi Hough để so khớp mẫu theo hướngcạnh để xác định hình dáng khuôn mặt ở dạng chụp hình thẳng ở dạng xám Tỷ lệ chínhxác trên 91% Ngàoi ra Shu và Jain còn xây dựng ngữ nghĩa khuôn mặt Ngữ nghĩa xâydựng theo hình dáng và vị trí các thành phần khuôn mặt Hai ông từ bộ ngữ nghĩa này tạomột đồ thị quan hệ để dễ dàng so khớp khi xác định khuôn mặt người …

nó xác định

Trang 18

Rất nhiều hướng tiếp cận dựa trên dường gấp khúc (snake) và các mẫu để xác định

khuôn mặt Đầu tiên ảnh sẽ được làm xoắn lại bởi một lọc làm mờ rồi dùng phép toánmorphology để làm nổi bật cạnh lên Tiếp theo dùng một đường gấp khúc có n điểm ảnh(giá trị n nhỏ) để tìm và ước lượng các đọan cong nhỏ Mỗi khuôn mặt được xấp xỉ bằngmột ellipse và biến đổi Hough, rồi tìm một ellipse nổi trội nhất Các ứng viên sẽ có bốntham số mô tả nột ellipse (để xác định khuôn mặt) Với mỗi ứng viên, một phương thứctương tự như phương thức mẫu biến dạng được dùng để xác định các đặc trưng ở mức chitiết Nếu tìm thấy số lượng đáng kể các đặc trưng khuôn mặt và thỏa mãn tỷ lệ cân đối thìxem như đã xác định được một khuôn mặt Lam và Yan cũng dùng đường gấp khúc để xácđịnh vị trí đầu với thuất toán greedy để cực tiểu hóa hàm năng lượng [18]

Thay vì dùng đường gấp khúc thì Huang và Su [19] dùng lý thuyết dòng chảy đểxác định đường viền khuôn mặt dựa trên đặc tính hình học Hai ông dùng lý thuyết tập hợp

đồng mức (Level Set) để loang từ các khởi động ban đầu để có được các khuôn mặt người.

Trang 19

CHƯƠNG 3: THUẬT TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ

DỰA TRÊN KỸ THUẬT NHẬN BIẾT MÀU DA

Phát hiện mặt người trong ảnh có nhiều ứng dụng trong cuộc sống, tuy nhiên, trongluận văn này, tôi chỉ xây dựng một chương trình nhỏ để minh họa cho các lý thuyết trìnhbày ở trên

3.1 Các kỹ thuật nhận biết màu da dựa trên tính chất điểm ảnh

Phát hiện dựa vào màu sắc của da người cũng là một trong những phương pháp đượcdùng để phát hiện mặt người Tuy nhiên nếu chỉ đơn thuần sử dùng màu sắc không thôi thìrất khó có thể đạt được hiệu quả cao trong phát hiện mặt người Vì trong các khung cảnhthì có rất nhiều vật có màu sắc tương tự như màu của khuôn mặt Tuy nhiên nếu kết hợpphương pháp này với các phương pháp khác lại có thể mang lại hiệu quả cao Vì kinhnghiệm cho thấy màu da người có đặc tính màu riêng biệt, và đặc tính này cho phép dễdàng nhận ra đâu là da người [27] Và thông thường trong hướng tiếp cận phát hiện mặtngười dựa trên thông tin xuất hiện trong ảnh, thì màu da được sử dụng như một bước phânvùng các vùng ảnh có màu sắc giống màu da, điều đó cho phép giảm không gian tìm kiếmkhuôn mặt, cải thiện hiệu năng của hệ thống tìm kiếm Do đó nhiều mô hình đã được xâydựng để có thể phát hiện được da người

Khi xây dựng hay mô hình hóa một hệ thống phát hiện hay phân tách vùng màu davới mục đích sử dụng cho việc phát hiện mặt người, người ta thường đặt ra ba vấn đềchính [28] sau: thứ nhất là mô hình đó được xây dựng trong không gian màu nào? thứ hai

là hàm phân phối của màu da được mô hình hóa chính xác đến mức độ nào và cuối cùng là

sẽ xử lý vùng màu da được phân vùng cho nhận biết mặt người như thế nào?

Phương pháp được được đề cập trong phần này là phương pháp phát hiện da ngườidựa trên đặc tính điểm ảnh, nghĩa là sẽ phân lớp điểm ảnh thành hai lớp, lớp là lớp điểmanh có thuộc màu da và lớp kia không phải là màu da Các điểm ảnh là hoàn toàn độc lậpvới nhau Ngược lại với phương pháp này là phương pháp dựa trên đặc tính vùng ảnh.Phát hiện màu da dựa trên đặc tính điểm ảnh có một lịch sử phát triển khá dài, tuy nhiêntrong khuôn khổ phần tổng quan này, chỉ đề cập và so sánh những kỹ thuật đã được công

bố và được đánh giá hiệu quả

Trang 20

Mục đích cuối cùng của phần tổng quan này là thu tập các kỹ thuật đã được công bố,

mô tả những ý tưởng chính của kỹ thuật đó, tổng hợp và đưa ra những ưu điểm, nhượcđiểm và những đặc trưng của từng kỹ thuật Từ đó sẽ đưa ra quyết định lựa chọn kỹ thuậtphù hợp dùng để phân vùng màu da áp dụng trong luận văn

3.1.1 Không gian màu sử dụng cho mô hình hóa màu da

Trong lĩnh vực đo màu, cũng như các lĩnh vực trong truyền tín hiệu hình ảnh vàvideo sử dụng rất nhiều không gian màu với các tính chất khác nhau Và trong số đó nhiềukhông gian màu được áp dụng cho vấn đề mô hình hóa màu da Sau đây là tóm lược nhómcác không gian màu được sử dụng rộng rãi nhất cũng như các tính chất của chúng

3.1.1.1 Không gian màu RGB

RGB là không gian màu cơ bản được áp dụng từ lâu cho màn hình CRT Trongkhông gian màu này, mỗi điểm màu là sự kết hợp của ba thành phần đơn màu (Đỏ - Red,Xanh lá cây- Green và xanh da trời: Blue) Đây là một trong những không gian màu được

sử dụng phổ biến nhất cho việc xử lý và lưu trữ dữ liệu ảnh số Tuy nhiên do tính tươngquan cao giữa các kênh, giá trị cảm nhận không đồng nhất, sự pha trỗn giữa dữ liệu thànhphần màu và dữ liệu về độ sáng mà không gian RGB không được ưa thích sử dụng choviệc phân tích màu cũng như trong các thuật toán nhận dạng dựa trên màu sắc

3.1.1.2 Không gian RGB chuẩn hóa

Không gian RGB chuẩn hóa là không gian màu nhận được từ không gian RGB cơbản theo công thức chuẩn hóa đơn giản sau đây:

Có thể dễ dàng thấy rằng, trong không gian này, r+g +b = 1 Do đó chỉ cần hai trong

ba thành phần trên là đủ để biểu diễn không gian màu này, thành phần thứ ba sẽ không còngiá trị và có thể được bỏ qua, để rút ngắn được số chiều của không gian này Hai thànhphần còn lại thường được gọi là các thành phần “màu tinh khiết” (“pure colors”) Thôngthường, hai thành phần r và b thường được giữ lại, còn b bị rút bỏ đi Tính chất cần chú ýcủa không gian màu này đó là tính bất biến đối với của bề mặt Nghĩa là, nếu như khôngquan tâm đến ánh sáng xung quanh, thì không gian chuẩn hóa RGB là bất biến đối với sựthay đổi về hướng bề mặt liên quan đến nguồn chiếu (tất nhiên là duới một vài giả thiết

Trang 21

nhất định) Kết hợp với phép chuyển đổi đơn giản từ không gian màu RGB cơ bản màkhông gian RGB chuẩn hóa này ngày càng được sử dụng rộng rãi trong nhiều lĩnh vực,trong đó có linh vực nhận dạng.

3.1.1.3 HIS, HSV, HSL - Độ bão hòa của màu

Không gian màu dựa trên tính bão hòa màu được giới thiệu khi có những nhu cầutrong việc xác định số lượng tính chất màu Chúng miêu tả màu sắc với những giá trịthuộc về trực giác, dựa trên ý kiến của các họa sỹ về những trạng thái khác nhau của màusắc, trạng thái bão hòa cũng như từng tông màu khác nhau Hue biểu thị cho màu trỗi (nhưmàu đỏ, màu xanh lá cây, màu đỏ tía và màu vàng) của một vùng ảnh, saturation (độ bãohòa) là thước đo cho giới mức ngưỡng màu của một vùng ảnh

Các khái niệm như “intensity” (cường độ), “lightness” (tính dịu) hay “value”(giá trị)

liên quan đến độ sáng của màu Giá trị trực giác của các thành phần trong không gian màunày và sự phân biệt rõ ràng giữa độ sáng với cá thành phần màu của không gian màu là ưuđiểm mà giúp cho không gian này được sử dụng phổ biến trong vấn đề phần vùng màu da.Công thức chuyển từ không gian RGB sang không gian này như sau:

1 313

H

R G B S

Hệ tọa độ cực giữa Hue và Saturation có thể gây ra nhiều khó khăn trong mô hìnhmàu da, chính vì vậy người ta còn chuyển nó sang hệ tọa độ Đềcác theo công thức sau:

3.1.1.4 TSL – Tint, Saturation, Lightness (sắc thái, độ bão hòa, độ dịu )

Trang 22

Không gian chuẩn hóa thành phần màu và độ sáng TSL được chuyển từ không gianchuẩn hóa RGB theo công thức sau đây:

3.1.1.5 YcrCb

YCrCblà không gian màu được sử dụng nhiều trong vấn đề nén ảnh Màu sắc dượcbiểu diễn bởi luma(đó là giá trị độ sáng được tính toán từ không gian RGB), gồm ba thànhphần, một thành phần là tổng các trọng số từ RGB, hai thành phần màu khác nhau Cr và

Cb được tạo ra bằng cách từ từ hai thành phần Red và Blue trong không gian màu RGB Công thức để chuyển đổi như sau:

r b

Việc chuyển đổi đơn giản, tính phân chia rõ ràng của độ sáng và các thành phần màu

là những đặc tính giúp cho không gian này lôi cuốn các nhà nghiên cứu sử dụng cho việc

mô hình hóa màu da

3.1.1.6 Các hệ tọa độ không gian màu khác

Bên cạnh YcrCb, một vài không gian màu khác đựoc tạo ra từ chuyển đổi tuyến tínhkhông gian RGB được sử dụng trong vấn đề phát hiện màu da Như là YES, YUV hayYIQ Tuy nhiên chúng ít được sử dụng hơn

3.1.2 Mô hình hóa màu da

Mục đích cuối cùng của phát hiện màu da là xây dựng một quy tắc có tính quyếtđịnh Đây là quy tắc sẽ giúp phân biệt một điểm ảnh là da hay không phải là da người.Thông thường, quy tắc này sẽ thiết lập một giá trị đo cho phép tính toán mức độ tương

Trang 23

đồng giữa một điểm ảnh màu với đặc trưng màu da Giá trị đo này được thiết lập như thếnào, công thức ra sao tùy thuộc vào từng phương pháp mô hình hóa màu da.

3.1.2.1 Xác định ngưỡng cụ thể một điểm ảnh là màu da

Trong một số không gian màu, phương pháp xây dựng và xếp lớp màu da bằng cáchxác định rõ ràng (thông qua một số quy tắc) biên giới các giá trị của điểm ảnh là màu dahay không

Ví dụ như: trong không gian RGB, (R,G,B) được xếp thuộc lớp màu da nếu như:

Tuy nhiên kết quả đạt được khi phân lớp là không cao trong trường hợp tổng quát Vìvậy khó khăn chính của phương pháp này nếu muốn có được hệ số nhận dạng cao đó làphải tìm ra được một không gian màu thích hợp cũng như các quy tắc tốt để nhận biết màu

da trong không gian màu này

Hiện nay người ta đang đề xuất sử dụng thuật toán máy học để tìm ra một không gianmàu thích hợp cũng như các quy tắc phân lớp màu da với mong muốn có được hệ số nhậndạng cao Tuy nhiên đó cũng chỉ mới là đề xuất và chưa có một kết quả cụ thể của mộtnghiên cứu nào đựoc công bố

Tuy nhiên, giữa và kết quả đạt được, chúng ta vẫn có thể tìm ra được những quy tắccho phép nhận biết chắc chắn một điểm ảnh không phải là màu da Những quy tắc này cóthể được sử dụng làm bước lọc khởi tạo cho các phương phân lớp pháp phức tạp hơn giữavùng màu da và vùng không phải màu da Nó giúp cho quá trình phân lớp được thực hiệnnhanh chóng hơn và đỡ tốn công hơn

3.1.2.2 Phương pháp mô hình hóa màu da sử dụng phân phối không tham số

Ý tưởng chính của phương pháp mô hình hóa màu da không tham số đó là ước lượngphân phối màu da từ dữ liệu huấn luyện mà không xuất phát từ một mô hình rõ ràng nào

Trang 24

của màu da Kết quả của phương pháp này thường được biểu diễn dưới dạng một bản đồ

phân bố màu da (SPM – Skin Probability Map).

Mỗi một giá trị phân bố được gán cho mỗi điểm trong không gian màu

3.1.2.2.1 Bảng tra cứu chuẩn hóa (LUT – Lookup Table)

Một số thuật toán phát hiện mặt người và bám sát mặt người sử dụng một lược đồmức xám dựa trên hướng tiếp cận phân vùng các điểm ảnh là màu da

Không gian màu được lượng tự hóa thành từng nhóm, mỗi một nhóm đáp ứng chomột khoảng các thành phần màu Các nhóm lược đồ này được tham chiếu tới một bảng gọi

là bảng tra cứu Mỗi một nhóm lưu trữ một số lượng lần xuất hiện của một màu khi tiếnhành huấn luỵện ảnh da người Sau quá trình huấn luyện, biểu đồ sẽ tính toán và chuẩnhóa, chuyển sang giá trị biểu đô trong phân phối xác suất miền rời rạc:

Trong đó, skin[c] nhận giá trị của nhóm lược đồ, đáp ứng cho véc tơ màu c, Norm làmột hệ số chuẩn hóa (tổng tất cả các giá trị của các nhóm biểu đồ) hay là giá trị lớn nhấtcủa một nhóm biểu đồ Giá trị chuẩn hóa của của bảng tra cứu các nhóm biểu đồ là căn cứ

để cho phép quyết định một màu có là màu da hay không?

3.1.2.2.2 Phân lớp Bayes (Bayes Classifier)

Giá trị của Pskin(c) trong công thức trên là một điều kiện xác suất – P(c|skin) – xácsuất một màu quan sát c là một pixel màu da Và xác suất thích hợp được dùng để pháthiện màu da đó là P(skin|c) – xác suất quan sát màu được màu da khi xuất hiện một giá trịmàu c rời rac Để tính giá trị này, ta sử dụng công thức Bayes quen thuộc :

Trong đó P(c|skin) và P(c|-skin) được tính trực tiếp từ biểu đồ màu da và không màu

da Xác suất toàn phần P(skin) và P(-skin) thì được ước lượng từ một số lượng các mẫu làmàu da và không màu da trong tập mẫu huấn luyện

Bất đẳng thức P(skin|c) > Θ, trong đó Θ là một giá trị ngưỡng, có thẻ được sử dụng

để trở thành quy tắc trong phát hiện màu da Công thức trên đôi khi hơi phức tạp, và để cóthể tránh điều này, nếu như thực sự không cần phải biết một cách chính xác suất P(skin|c)

Trang 25

và P(-skin|c) mà chỉ cần biết tỉ số giữa chúng thì người ta thường đưa vê công thức nhưsau:

P skin c P skin c P skin

P skin c = P c skin P skin

So sánh công thức này với một ngưỡng có thể tạo ra một quy tắc cho phép phát hiện

tỉ số màu da/không phải màu da Sau một vài phép biến đổi, chúng ta nhận được công thức

P c skin

P c skin

P skin K

3.1.2.2.3 Tổng kết phương pháp không tham số

Hai ưu điểm dễ thấy của phương pháp mô hình hóa phân phối không tham số đó là:thứ nhất, chúng có thể huấn luyện và sử dụng được một cách nhanh chóng Thứ hai, chúngđộc lập với lý thuyết vè hình dạng của phân phối màu da (điều này không đúng trong môhình hóa màu da có tham số) Tuy nhiên nhược điểm của phương pháp này đó là chúngyêu cầu nhiều bộ nhớ để lưu trữ và không có khả năng nội suy hay tạo ra dữ liệu huấnluyện Lấy ví dụ như, chúng ta lượng tử hóa điểm ảnh trong không gian RGB về 8bit chomỗi màu, khi đó chúng ta phải cần một mảng có tới 224 phần tử để lưư trữ tập tất cả cácxác suất của mô hình

Để có thể giảm bớt kích thước này bằng cách loại bỏ những dữ liệu huấn luyện nhỏ

lẻ, không gian màu thường sử dụng kích thước 128*128*128, 64*64*64, 32*32*32 Theonhư nghiên cứu thì kích thước 32*32*32 là kích thước không gian mang lại hiệu quả caonhất

3.1.2.3 Mô hình hóa phân phố màu da có tham số

Hầu hết các mô hình màu da không tham số dựa trên biểu đồ xám đều yêu cầu rấtnhiều bộ nhớ và hiệu năng của chúng phụ thuộc hoàn toàn của tập ảnh huấn luyện cố định

Ngày đăng: 12/12/2016, 16:32

HÌNH ẢNH LIÊN QUAN

Hình 2.1: Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down. - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 2.1 Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down (Trang 11)
Hình 2.2: Phương pháp chiếu: (a) Ảnh chỉ có một khuôn mặt và hình nền đơn giản; - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 2.2 Phương pháp chiếu: (a) Ảnh chỉ có một khuôn mặt và hình nền đơn giản; (Trang 12)
Hình 2.3: Một mẫu khuôn mặt có kích thước 14 x 16 pixel được sử dụng trong phương pháp định - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 2.3 Một mẫu khuôn mặt có kích thước 14 x 16 pixel được sử dụng trong phương pháp định (Trang 17)
Hình 3.1. Màu sắc hình ảnh và các thành phần R, G và B [25] - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.1. Màu sắc hình ảnh và các thành phần R, G và B [25] (Trang 30)
Hình 3.3 cho thấy một ví dụ về một hình ảnh từ cơ sở dữ liệu. Ở đó, hình ảnh ban đầu - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.3 cho thấy một ví dụ về một hình ảnh từ cơ sở dữ liệu. Ở đó, hình ảnh ban đầu (Trang 33)
Hình 3.4. Bản gốc hình ảnh tại đầu vào phát hiện và mặt nạ thích hợp xác định các - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.4. Bản gốc hình ảnh tại đầu vào phát hiện và mặt nạ thích hợp xác định các (Trang 35)
Hình 3.5. Định nghĩa trung tâm của khuôn mặt - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.5. Định nghĩa trung tâm của khuôn mặt (Trang 36)
Hình 3.6. Ví dụ 1 về phân lớp của khuôn mặt - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.6. Ví dụ 1 về phân lớp của khuôn mặt (Trang 37)
Hình 3.7. Ví dụ 2 về phân lập của khuôn mặt - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.7. Ví dụ 2 về phân lập của khuôn mặt (Trang 37)
Hình 3.8. Các phân tích của khuôn mặt và tiền xử lý mới - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.8. Các phân tích của khuôn mặt và tiền xử lý mới (Trang 38)
Hình 3.9a. Các bước để xác định tọa độ của mắt trung tâm - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.9a. Các bước để xác định tọa độ của mắt trung tâm (Trang 39)
Hình 3.10. Cấu trúc hệ thống xác định và chuẩn hóa mặt người - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.10. Cấu trúc hệ thống xác định và chuẩn hóa mặt người (Trang 40)
Hình 3.11. Khuôn mặt trong cơ sở dữ liệu FERET[36] - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.11. Khuôn mặt trong cơ sở dữ liệu FERET[36] (Trang 42)
Hình 3.12. Kết quả phát hiện mặt người trong cơ sở dữ liệu FERET COLOR - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.12. Kết quả phát hiện mặt người trong cơ sở dữ liệu FERET COLOR (Trang 43)
Hình 3.13. Kết quả phát hiện mặt người trong cơ sở dữ liệu CAMERA - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.13. Kết quả phát hiện mặt người trong cơ sở dữ liệu CAMERA (Trang 44)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w