1. Trang chủ
  2. » Công Nghệ Thông Tin

Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

30 180 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 30
Dung lượng 4,53 MB
File đính kèm LUAN VAN THAC SY.rar (3 MB)

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Chương 1: Bài toán xác định mặt người trong ảnh số. Giới thiệu tổng quan về bài toán xác định mặt người trong ảnh, các ứng dụng và những khó khăn của bài toán. Chương 2: Các kỹ thuật xác định mặt người trong ảnh số. Phân tích các kỹ thuật xác định mặt người trong ảnh số.Chương 3: Thuật toán xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da. Tập chung phân tích kỹ thuật phát hiện vị trí mặt người dựa trên đặc trưng màu da. Từ đó đề xuất thuật toán xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da và thực nghiệm.

Trang 1

MỤC LỤC

MỤC LỤC 1

MỞ đẦu 3

CHƯƠNG 1 4

BÀI TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ 4

1.1 Giới thiệu về bài toán xác định mặt người trong ảnh số 4

1.2 Những khó khăn và thách thức đối với bài toán xác định mặt người 4

1.3 Các ứng dụng của xác định mặt người 5

1.4 Xác định phạm vi đề tài 5

CÁC KỸ THUẬT XÁC ĐỊNH VỊ TRÍ MẶT NGƯỜI TRONG ẢNH SỐ 6

2.1 Phương pháp xác định vị trí mặt người dựa trên tri thức 6

2.1.1 Tư tưởng của phương pháp xác định vị trí mặt người dựa trên tri thức 6

2.1.2 Các nghiên cứu liên quan 6

2.2 Phương pháp xác định vị trí mặt người dựa trên đặc trưng không thay đổi 6

2.3 Phương pháp xác định vị trí mặt người dựa trên so sánh khớp mẫu 7

2.4 Phương pháp xác định vị trí mặt người dựa trên diện mạo 7

2.4.1 Tư tưởng của phương pháp xác định vị trí mặt người dựa trên diện mạo 7

2.4.2 Phương pháp PCA (Principal Components Analysis) 7

2.4.3 Phương pháp ICA (Independent component analysis) 7

2.4.4 Phương pháp sử dụng mạng Neural 7

2.4.5 Phương pháp SVM 7

2.4.6 Phương pháp sử dụng mô hình Markov ẩn 7

2.4.7 Phương pháp dựa trên phân loại Bayes 7

CHƯƠNG 3: THUẬT TOÁN XÁC ĐỊNH VỊ TRÍ MẶT NGƯỜI TRONG ẢNH SỐ DỰA TRÊN KỸ THUẬT NHẬN BIẾT MÀU DA 8

3.1 Các kỹ thuật nhận biết màu da dựa trên tính chất điểm ảnh 8

3.1.1 Không gian màu sử dụng cho mô hình hóa màu da 9

3.1.2 Mô hình hóa màu da 9

3.1.2.1 Xác định ngưỡng cụ thể một điểm ảnh là màu da 9

3.1.2.2 Phương pháp mô hình hóa màu da sử dụng phân phối không tham số 10 3.1.2.3 Mô hình hóa phân phố màu da có tham số 12

3.1.3 So sánh và đánh giá các mô hình 13

Trang 2

3.2 Thuật toán xác định ảnh màu dựa trên màu da 14

3.2.1 Định vị vùng khuôn mặt người trong ảnh màu 14

3.2.2 Giai đoạn tiền xử lý hình ảnh ban đầu 18

3.2.2.1 Định nghĩa của một khuôn mặt người 19

3.2.2.2 Thuật toán xác định vị trí khuôn mặt dựa trên kỹ thuật mặt nạ 19

3.2.2.3 Xác định tọa độ của trung tâm của khuôn mặt 20

3.3 Kết quả thực nghiệm và đánh giá 25

KẾT LUẬN 27

Trang 3

MỞ ĐẦU

Công nghệ thông tin đã và đang được ứng dụng rộng rãi trong mọi lĩnh vực của cuộcsống Với một hệ thống máy tính, chúng ta có thể làm được rất nhiều việc từ đơn giản đếnphức tạp Máy tính giúp con người tiết kiện thời gian và công sức khi xử lý các công việctrong thực tế Điển hình như công việc nhận dạng mặt người Trước đây, khi muốn tìmkiếm một kẻ tình nghi trong siêu thị hay sân bay, các nhân viên an ninh phải tìm kiếm trêntừng màn hình của các camera theo dõi Ngày nay, công việc đấy đã được làm tự động nhờcác hệ thống nhận dạng mặt người Phát hiện vị trí mặt người trong ảnh là một phần quantrọng của hệ thống nhận dạng đó Nếu giải quyết tốt việc phát hiện vị trí mặt người sẽ giúpchúng ta tiết kiệm thời gian và nâng cao độ chính xác của việc nhận dạng khuôn mặt.Phát hiện vị trí mặt người cũng là một bài toán nhận dạng đơn giản, hệ thống chỉ cầnphân loại đối tượng đưa vào có phải mặt người hay không phải mặt người Ở mức độ caohơn, sau khi đã phát hiện được khuôn mặt, các khuôn mặt đó sẽ được so sánh với cáckhuôn mặt có trong dữ liệu để nhận dạng xem khuôn mặt đấy là của ai (thường áp dụngtrong nhận dạng khuôn mặt của người nổi tiếng hoặc của tội phạm đang bị truy nã)

Bài toán phá hiện mặt người được bắt đầu nghiên cứu từ những năm 1990, và đã córất nhiều công trình nghiên cứu về phát hiện khuôn mặt trong ảnh, tuy nhiên cho đến nay,các nhà khoa học vẫn không ngừng tìm các hướng tiếp cận mới, các thuật toán mới nhằmnâng cao hiệu suất của việc phát hiện khuôn mặt cũng như việc nhận dạng mặt người.Với mục tiêu chính là tìm hiểu, phân tích các thuật toán phát hiện vị trí mặt ngườihiện nay và đưa ra cách tiếp cận mới để áp dụng vào bài toán phát hiện vị trí mặt ngườitrong ảnh, luận văn được trình bày trong 3 chương với bố cục như sau:

Chương 1: Bài toán xác định mặt người trong ảnh số Giới thiệu tổng quan về bài

toán xác định mặt người trong ảnh, các ứng dụng và những khó khăn của bài toán

Chương 2: Các kỹ thuật xác định mặt người trong ảnh số Phân tích các kỹ thuật

Cuối cùng là kết luận và hướng phát triển: Tóm tắt những kết quả đạt được, những

hạn chế và nêu lên các hướng phát triển trong tương lai

Trang 4

CHƯƠNG 1 BÀI TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ

1.1 Giới thiệu về bài toán xác định mặt người trong ảnh số

Trong những năm qua, có rất nhiều công trình nghiên cứu về bài toán nhận dạng mặtngười Các nghiên cứu đi từ bài toán đơn giản, từ việc nhận dạng một mặt người trong ảnhđen trắng cho đến mở rộng cho ảnh mầu và có nhiều mặt người trong ảnh Đến nay các bàitoán xác định mặt người đã mở rộng với nhiều miền nghiên cứu như nhận dạng khuônmặt, định vị khuôn mặt, xác định trạng thái mắt người, theo dõi mặt người hay nhận dạngcảm xúc mặt người…

Phát hiện vị trí mặt người trong ảnh là phần đầu tiên của một hệ thống nhận dạng mặtngười Các hệ thống nhận dạng khuôn mặt được bắt đầu xây dựng từ những năm 1970, tuynhiên do còn hạn chế về các luật xác định mặt người nên chỉ được áp dụng trong một sốứng dụng như nhận dạng thẻ căn cước Nó chỉ được phát triển mạnh mẽ từ những năm

1990 khi có những tiến bộ trong công nghệ video và ngày nay thì các ứng dụng của xácđịnh mặt người đã trở nên phổ biến trong cuộc sống [1]

Định nghĩa bài toán xác định mặt người: Xác định khuôn mặt người là một kỹ thuậtmáy tính để xác định các vị trí và kích thước của các khuôn mặt người trong các ảnh số bất

kì Kỹ thuật này nhận biết các đặc trưng của khuôn mặt và bỏ qua những thứ khác xungquanh đối tượng như: tòa nhà, cây cối, cơ thể…

1.2 Những khó khăn và thách thức đối với bài toán xác định mặt người.

Việc xác định khuôn mặt người có những khó khăn nhất định như:

- Hướng (pose) của khuôn mặt đối với máy ảnh, như: nhìn thẳng, nhìn

nghiêng hay nhìn từ trên xuống Cùng trong một ảnh có thể có nhiều khuônmặt ở những tư thế khác nhaud

- Sự có mặt của các chi tiết không phải là đặc trưng riêng của khuôn mặtngười, như: râu quai nón, mắt kính, …

- Các nét mặt (facial expression) khác nhau trên khuôn mặt, như: vui, buồn,

ngạc nhiên, …

- Mặt người bị che khuất bởi các đối tượng khác có trong ảnh

Trang 5

- Sự biểu cảm của khuôn mặt: sự biểu cảm có thể làm thay đổi đáng kể cácđặc trưng và thông số của khuôn mặt, ví dụ như khuôn mặt của cùng mộtngười sẽ rất khác khi người đấy cười, tức giận hay sợ hãi …

1.3 Các ứng dụng của xác định mặt người

1.4 Xác định phạm vi đề tài

Trong đề tài này, tôi tập trung vào việc xác định khuôn mặt trong ảnh dựa trên nhậnbiết màu da Từ đấy lưu khuôn mặt tìm được vào cơ sử dữ liệu để phục vụ cho các mục

đích khác (chẳng hạn như nhận dạng mặt người hoặc ghép khuôn mặt vào bức ảnh

khác…) Do các điều kiện khó khăn đã nêu ở trên tôi xin đưa ra những giả định và ràng

buộc sau để giảm độ phức tạp của bài toán:

- Các khuôn mặt được chụp thẳng hoặc góc nghiêng không đáng kể (nhỏ hơnhoặc bằng 10o)

- Phông nền của ảnh không quá phức tạp

- Ảnh được chụp trong điều kiện ánh sáng bình thường

Trang 6

CHƯƠNG 2 CÁC KỸ THUẬT XÁC ĐỊNH VỊ TRÍ MẶT NGƯỜI TRONG ẢNH SỐ

Dựa vào tính chất của các phương pháp xác định mặt người trên ảnh, các phươngpháp này được chia thành bốn loại chính, tương ứng với bốn hướng tiếp cận khác nhau.Ngoài ra cũng có rất nhiều nghiên cứu mà phương pháp xác định mặt người không chỉ dựavào một hướng mà có liên quan đến nhiều hướng

2.1 Phương pháp xác định vị trí mặt người dựa trên tri thức

2.1.1 Tư tưởng của phương pháp xác định vị trí mặt người dựa trên tri thức

Trong cách tiếp cận này, các phương pháp xác định mặt người được xây dựng dựavào các luật, các luật này phụ thuộc vào tri thức của các tác giả nghiên cứu về bài toán xácđịnh khuôn mặt Dễ dàng xây dựng các luật cơ bản để mô tả các đặc trưng của khuôn mặt

và các quan hệ tương ứng Ví dụ, một khuôn mặt thường có hai mắt đối xứng qua trụcthẳng đứng giữa khuôn mặt và có một mũi một miệng Các quan hệ đặc trưng có thể làquan hệ về vị trí và khoảng cách tương đối Khó khăn của hướng tiếp cận này đó là làmthế nào để chuyển các tri thức của con người về khuôn mặt sang các luật cho máy tính mộtcách hiệu quả Nếu các luật này quá chi tiết, chặt chẽ thì sẽ có thể xác định thiếu cáckhuôn mặt có trong ảnh, nhưng nếu các luật quá tổng quát thì sẽ dẫn đến xác định sai khuvực không phải là khuôn mặt thành khuôn mặt Ngoài ra cũng khó để mở rộng phạm vicủa bải toán để xác định các khuôn mặt có nhiều tư thế khác nhau

2.1.2 Các nghiên cứu liên quan

2.2 Phương pháp xác định vị trí mặt người dựa trên đặc trưng không thay đổi

Tiếp cận dựa trên các đặc trưng không thay đổi là tiếp cận theo kiểu Bottom-Up Dựatrên thực tế, chúng ta cố gắng tìm ra những đặc điểm không thay đổi khi của khuôn mặtkhi ở các tư thế khác nhau và các điều kiện môi trường như ánh sáng khác nhau Đã có rấtnhiều nghiên cứu về hướng tiếp cận này, các đặc điểm không thay đổi được tìm thấy nhưlông mày, mắt, mũi, miệng hay các đường viền trên tóc… Trên cơ sở các đặc trưng này,các nhà nghiên cứu xây dựng lên một mô hình thống kê mô tả quan hệ của các đặc trưng

và từ đó xác định sự xuất hiện của khuôn mặt trong bức ảnh Khó khăn của hướng tiếp cậnnày đó là phải mô tả các đặc trưng không thay đổi và quan hệ giữa chúng phù hợp với điềukiện ánh sáng, độ nhiễu hay bị che khuất

Trang 7

2.3 Phương pháp xác định vị trí mặt người dựa trên so sánh khớp mẫu

2.4 Phương pháp xác định vị trí mặt người dựa trên diện mạo

2.4.1 Tư tưởng của phương pháp xác định vị trí mặt người dựa trên diện mạo

Trái ngược với hướng tiếp cận dựa trên so sánh khớp mẫu (các mẫu đã được các nhànghiên cứu định nghĩa trước), các mẫu trong hướng tiếp cận này được học từ một tập ảnhmẫu Có thể nói hướng tiếp cận dựa trên diện mạo áp dụng các kỹ thuật theo hướng xácsuất thống kê và học máy để tìm những đặc tính liên quan của khuôn mặt và không phải làkhuôn mặt Các đặc tính đã được học ở trong hình thái các mô hình phân bố hay các tham

số của một hàm số nên có thể dùng các đặc tính này để xác định khuôn mặt người Đồngthời, bài toán giảm số chiều thường được quan tâm để tăng hiệu quả tính toán cũng nhưhiệu quả xác định

Trong hướng tiếp cận này, phương pháp xác xuất tiếp tục được nhiều nhà nghiên cứu

sử dụng Một bức ảnh hoặc một vector (đặc trưng cho bức ảnh) được xem như một biếnngẫu nhiên Biến ngẫu nhiên này sẽ được xác định là có mô tả các đặc tính của khuôn mặt

hay không thông qua các xác xuất có điều kiện p(x/face) và p(x/nonface) Có thể dùng bộ

phân loại Bayesian để phân loại các ứng viên là khuôn mặt hay không phải khuôn mặt.Tuy nhiên, việc cài đặt bộ phân loại Bayesian với số chiều x lớn là một điều khá khó khăn,

do đó có rất nhiều nghiên cứu theo hướng tiếp cận này quan tâm tới việc tham số hóa hay

không tham số các xác suất p(x/face) và p(x/nonface).

Một các tiếp cận khác trong hướng tiếp cận dựa trên diện mạo là tìm một hàm biệt số

ví dụ như các hàm mô tả mặt phẳng hay siêu phẳng quyết định (các ranh giới) để phân biệthai lớp khuôn mặt và không phải khuôn mặt Thông thường, một bức ảnh được chiếu vàokhông gian có số chiều ít hơn rồi sau đó dùng một hàm biệt số (dựa trên các độ đo khoảngcách) để phân loại hoặc xây dựng một mặt quyết định phi tuyến bằng mạng neural đa tầng

Ngoài ra có thể dùng SVM (Super Vector Machine) và các phương thức kernel chiếu các

mẫu vào không gian có số chiều cao hơn để dữ liệu bị rời rạc hoàn toàn và từ đó có thể sửdụng mặt phẳng phân loại để phân loại các mẫu là khuôn mặt hay không phải là khuônmặt

2.4.2 Phương pháp PCA (Principal Components Analysis)

2.4.3 Phương pháp ICA (Independent component analysis)

2.4.4 Phương pháp sử dụng mạng Neural

2.4.5 Phương pháp SVM

2.4.6 Phương pháp sử dụng mô hình Markov ẩn

2.4.7 Phương pháp dựa trên phân loại Bayes

Trang 8

CHƯƠNG 3: THUẬT TOÁN XÁC ĐỊNH VỊ TRÍ MẶT NGƯỜI TRONG

ẢNH SỐ DỰA TRÊN KỸ THUẬT NHẬN BIẾT MÀU DA

Phát hiện vị trí mặt người trong ảnh có nhiều ứng dụng trong cuộc sống, tuy nhiên,trong luận văn này, tôi chỉ xây dựng một chương trình nhỏ để minh họa cho các lý thuyếttrình bày ở trên

3.1 Các kỹ thuật nhận biết màu da dựa trên tính chất điểm ảnh

Phát hiện dựa vào màu sắc của da người cũng là một trong những phương pháp đượcdùng để phát hiện vị trí mặt người Tuy nhiên nếu chỉ đơn thuần sử dùng màu sắc khôngthôi thì rất khó có thể đạt được hiệu quả cao trong phát hiện vị trí mặt người Vì trong cáckhung cảnh thì có rất nhiều vật có màu sắc tương tự như màu của khuôn mặt Tuy nhiênnếu kết hợp phương pháp này với các phương pháp khác lại có thể mang lại hiệu quả cao

Vì kinh nghiệm cho thấy màu da người có đặc tính màu riêng biệt, và đặc tính này chophép dễ dàng nhận ra đâu là da người [27] Và thông thường trong hướng tiếp cận pháthiện vị trí mặt người dựa trên thông tin xuất hiện trong ảnh, thì màu da được sử dụng nhưmột bước phân vùng các vùng ảnh có màu sắc giống màu da, điều đó cho phép giảmkhông gian tìm kiếm khuôn mặt, cải thiện hiệu năng của hệ thống tìm kiếm Do đó nhiều

mô hình đã được xây dựng để có thể phát hiện được da người

Khi xây dựng hay mô hình hóa một hệ thống phát hiện hay phân tách vùng màu davới mục đích sử dụng cho việc phát hiện vị trí mặt người, người ta thường đặt ra ba vấn đềchính [28] sau: thứ nhất là mô hình đó được xây dựng trong không gian màu nào? thứ hai

là hàm phân phối của màu da được mô hình hóa chính xác đến mức độ nào và cuối cùng là

sẽ xử lý vùng màu da được phân vùng cho nhận biết mặt người như thế nào?

Phương pháp được đề cập trong phần này là phương pháp phát hiện da người dựatrên đặc tính điểm ảnh, nghĩa là sẽ phân lớp điểm ảnh thành hai lớp, lớp là lớp điểm anh cóthuộc màu da và lớp kia không phải là màu da Các điểm ảnh là hoàn toàn độc lập vớinhau Ngược lại với phương pháp này là phương pháp dựa trên đặc tính vùng ảnh Pháthiện màu da dựa trên đặc tính điểm ảnh có một lịch sử phát triển khá dài, tuy nhiên trongkhuôn khổ phần tổng quan này, chỉ đề cập và so sánh những kỹ thuật đã được công bố vàđược đánh giá hiệu quả

Trang 9

Mục đích cuối cùng của phần tổng quan này là thu tập các kỹ thuật đã được công bố,

mô tả những ý tưởng chính của kỹ thuật đó, tổng hợp và đưa ra những ưu điểm, nhượcđiểm và những đặc trưng của từng kỹ thuật Từ đó sẽ đưa ra quyết định lựa chọn kỹ thuậtphù hợp dùng để phân vùng màu da áp dụng trong luận văn

3.1.1 Không gian màu sử dụng cho mô hình hóa màu da

3.1.2 Mô hình hóa màu da

3.1.2.1 Xác định ngưỡng cụ thể một điểm ảnh là màu da

Trong một số không gian màu, phương pháp xây dựng và xếp lớp màu da bằng cáchxác định rõ ràng (thông qua một số quy tắc) biên giới các giá trị của điểm ảnh là màu dahay không

Ví dụ như: trong không gian RGB, (R,G,B) được xếp thuộc lớp màu da nếu như:

Tuy nhiên kết quả đạt được khi phân lớp là không cao trong trường hợp tổng quát Vìvậy khó khăn chính của phương pháp này nếu muốn có được hệ số nhận dạng cao đó làphải tìm ra được một không gian màu thích hợp cũng như các quy tắc tốt để nhận biết màu

da trong không gian màu này Hiện nay người ta đang đề xuất sử dụng thuật toán máy học

để tìm ra một không gian màu thích hợp cũng như các quy tắc phân lớp màu da với mongmuốn có được hệ số nhận dạng cao Tuy nhiên đó cũng chỉ mới là đề xuất và chưa có mộtkết quả cụ thể của một nghiên cứu nào đựoc công bố

Tuy nhiên, giữa và kết quả đạt được, chúng ta vẫn có thể tìm ra được những quy tắccho phép nhận biết chắc chắn một điểm ảnh không phải là màu da Những quy tắc này cóthể được sử dụng làm bước lọc khởi tạo cho các phương phân lớp pháp phức tạp hơn giữavùng màu da và vùng không phải màu da Nó giúp cho quá trình phân lớp được thực hiệnnhanh chóng hơn và đỡ tốn công hơn

Trang 10

3.1.2.2 Phương pháp mô hình hóa màu da sử dụng phân phối không tham số

Ý tưởng chính của phương pháp mô hình hóa màu da không tham số đó là ước lượngphân phối màu da từ dữ liệu huấn luyện mà không xuất phát từ một mô hình rõ ràng nàocủa màu da Kết quả của phương pháp này thường được biểu diễn dưới dạng một bản đồ

phân bố màu da (SPM – Skin Probability Map) Mỗi một giá trị phân bố được gán cho mỗi

điểm trong không gian màu

3.1.2.2.1 Bảng tra cứu chuẩn hóa (LUT – Lookup Table)

Một số thuật toán phát hiện vị trí mặt người và bám sát mặt người sử dụng một lược

đồ mức xám dựa trên hướng tiếp cận phân vùng các điểm ảnh là màu da

Không gian màu được lượng tự hóa thành từng nhóm, mỗi một nhóm đáp ứng chomột khoảng các thành phần màu Các nhóm lược đồ này được tham chiếu tới một bảng gọi

là bảng tra cứu Mỗi một nhóm lưu trữ một số lượng lần xuất hiện của một màu khi tiếnhành huấn luỵện ảnh da người Sau quá trình huấn luyện, biểu đồ sẽ tính toán và chuẩnhóa, chuyển sang giá trị biểu đô trong phân phối xác suất miền rời rạc:

Trong đó,

• skin[c] nhận giá trị của nhóm lược đồ, đáp ứng cho véc tơ màu c

• Norm là một hệ số chuẩn hóa (tổng tất cả các giá trị của các nhóm biểu đồ)hay là giá trị lớn nhất của một nhóm biểu đồ

Giá trị chuẩn hóa của của bảng tra cứu các nhóm biểu đồ là căn cứ để cho phép quyếtđịnh một màu có là màu da hay không?

3.1.2.2.2 Phân lớp Bayes (Bayes Classifier)

Giá trị của Pskin(c) trong công thức trên là một điều kiện xác suất – P(c|skin) – xácsuất một màu quan sát c là một pixel màu da Và xác suất thích hợp được dùng để pháthiện màu da đó là P(skin|c) – xác suất quan sát màu được màu da khi xuất hiện một giá trịmàu c rời rac

Để tính giá trị này, ta sử dụng công thức Bayes quen thuộc :

Trang 11

Trong đó:

• P(c|skin) và P(c|-skin) được tính trực tiếp từ biểu đồ màu da và không màu da

• Xác suất toàn phần P(skin) và P(-skin) thì được ước lượng từ một số lượngcác mẫu là màu da và không màu da trong tập mẫu huấn luyện

Bất đẳng thức P(skin|c) > Θ, trong đó Θ là một giá trị ngưỡng, có thẻ được sử dụng

để trở thành quy tắc trong phát hiện màu da Công thức trên đôi khi hơi phức tạp, và để có

thể tránh điều này, nếu như thực sự không cần phải biết một cách chính xác suất P(skin|c)

và P(-skin|c) mà chỉ cần biết tỉ số giữa chúng thì người ta thường đưa về công thức như

P skin c P skin c P skin

P skin c = P c skin P skin

So sánh công thức này với một ngưỡng có thể tạo ra một quy tắc cho phép phát hiện

tỉ số màu da/không phải màu da Sau một vài phép biến đổi, chúng ta nhận được công thức

3.1.2.2.3 Tổng kết phương pháp không tham số

Hai ưu điểm dễ thấy của phương pháp mô hình hóa phân phối không tham số đó là:thứ nhất, chúng có thể huấn luyện và sử dụng được một cách nhanh chóng Thứ hai, chúngđộc lập với lý thuyết vè hình dạng của phân phối màu da (điều này không đúng trong môhình hóa màu da có tham số) Tuy nhiên nhược điểm của phương pháp này đó là chúngyêu cầu nhiều bộ nhớ để lưu trữ và không có khả năng nội suy hay tạo ra dữ liệu huấnluyện Lấy ví dụ như, chúng ta lượng tử hóa điểm ảnh trong không gian RGB về 8bit chomỗi màu, khi đó chúng ta phải cần một mảng có tới 224 phần tử để lưư trữ tập tất cả cácxác suất của mô hình Để có thể giảm bớt kích thước này bằng cách loại bỏ những dữ liệu

Trang 12

huấn luyện nhỏ lẻ, không gian màu thường sử dụng kích thước 128*128*128, 64*64*64,32*32*32 Theo như nghiên cứu thì kích thước 32*32*32 là kích thước không gian manglại hiệu quả cao nhất.

3.1.2.3 Mô hình hóa phân phố màu da có tham số

3.1.2.3.1 Mô hình dựa trên phấn phối Gaussian đơn.

Phân phối màu da có thể đựoc mô hình hóa bởi phân phối Gaussian thêm vào hàmmật độ xác suất Đĩnh nghĩa như sau:

Trong đó: c là một véctơ màu, µs và Σs là hai tham số phân phối (véctơ trùng bình và

ma trận hiệp phương sai) Các tham số của mô hình được ước lượng thông qua quá trìnhhuấn luyện bởi công thức sau:

n

j

T n

c n

c c n

Trong đó, n là tổng số các mẫu màu da Xác suất p(c|skin) có thể được tính trực tiếp

mức độ tưong tự màu da (likehood skin color) hoặc có thể tính bằng khoảng cách

Mahalanobis từ vé tơ màu c, véc tơ trung bình µs, ma trận hiệp phương sai Σs

Công thức tính khoảng cách Mahalanonbis:

3.1.2.3.2 Mô hình kết hợp dựa trên phân phối Gaussian

Một mô hình công phu, phức tạp hơn, có khả năng biểu diễn được phân phối phứctạp đó là mô hình két hợp dựa trên phân phối Gaussian Đây là mô hình mở rộng từ môhình đơn Gaussian trên, trong trường hợp này, hàm phân phối mật độ xác suất là:

Trang 13

Trong đó: k là số lượng các thành phần được kết hợp; πi là tham số kết hợp, thỏa mãnràng buộc k1 1

ii

∑ = , và p i (c|skin) thỏa mãn hàm phối mật độ xác suất Gaussian, với mỗi

véc tơ trung bình và ma trận hiệp phương sai của nó

Huấn luyện mô hình được thực hiện với một kĩ thuật được biết đến nhiều gọi là thuật

toán kì vọng tối đa (EM - Expectation Maximization), trong đó giả sử rằng số lượngcác

thành phần k là đã biết trước Chi tiết việc huấn luyện mô hình kết hợp Gaussian với thuậttoán EM này có thể được tìm thấy trong nhiều nghiên cứu Việc phân lớp trong mô hình

kết hợp Gaussian được thực hiện nhờ việc so sánh xác suất p(c|skin) với một vài giá trị

ngưỡng Việc chọn lựa số lượng thành phần k ở đây là quan trọng Vì nó ảnh hưởng đến độchính xác của việc huấn luyện cho mô hình Theo như những nghiên cứu hiện nay, k=8 là

sự lựa chọn mang hiệu năng cao nhất cho mô hình kết hợp phân phối Gausian

3.1.2.3.3 Đa phân phối Gausian

3.1.2.3.4 Tổng kết các phưong pháp mô hình hóa theo tham số

3.1.3 So sánh và đánh giá các mô hình

Để có thể đánh giá và so sánh hiệu năng của các phương pháp mô hình hóa màu da làkhông dễ, vì mỗi phương pháp thường được đề xuât của một nhóm các nhà nghiên cứu vàđược thử nghiệm trên cơ sơ dữ liệu riêng Và chưa có một cơ sở dữ liệu chuẩn nào đượccông bố rộng rãi cho vấn đề này Cơ sở dữ liệu huấn luyện và kiểm định được biết đếnnhiều nhất đó là cơ sở dữ liệu của Compaq

Trong bảng so sánh được đưa ra dưới đây, là kết quả tốt nhất mà mỗi phương phápđạt được, được tổng hợp bởi [Valimir Vezhnevets, Vassili Sazonov Alla Andreeva], với kếtquả thử nghiệm dựa trên có ở dữ liệu của Compaq nêu trên Bảng 3.1 sau đây sẽ so sánh

hệ số phát hiện đúng và không đúng của từng phương pháp Mặc dù các phương pháp làkhác nhau về dữ liệu huấn luyện và tập dữ liệu test, cũng như chiến lược huấn luyện, bảngdưới đây vẫn mô tả một bức tranh toàn cảnh về hiệu năng của các phương pháp [7]

Ưu điểm chính của các phương pháp sử dụng các ngưỡng để phân lớp điểm ảnh làmàu da hay không đó là tính đơn giản và tính trực giác cao trong các quy tắc phân lớp.Tuy nhiên, điểm khó khăn đó là cần phải tìm được cả một không gian màu tốt và các quytắc xứng đáng trong không gian đó Phương pháp được đề xuất hiện này sử dụng thuật

Trang 14

toán máy học để có thể tìm được không gian và các quy tắc thích hợp, tuy nhiên đề xuấtnày vẫn đang là một vấn đề mở trong tương lai

Bảng 3.1 Kết quả nhận biết đúng và sai của các phương pháp

Các phương pháp sử dụng mô hình hóa không tham số thật sự nhanh trong cả việchuấn luyện và phân lớp, độc lập với phân bố hình dạng của màu da và cả không gian màu.Tuy nhiên, phương pháp này lại yêu cầu quá nhiều bộ nhớ lưu trữ và phụ thuộc cố dịnhvào tập dữ liệu huấn luyện

Các phương pháp mô hình hóa có tham số cũng xử lý khá nhanh Hơn nữa chúng lại

có khả năng tự tạo ra các dữ liệu huấn luyện phù hợp, chúng được miêu tả bằng một sốlượng không nhiều các tham số và đặc biệt chúng cần không đáng kể bộ nhớ lưu trữ Tuynhiên, chúng có thể sẽ thực sự chậm (giống như mô hình kết hợp giữa trên phân phốiGaussian) trong cả huấn luyện và làm việc, và hiệu năng của chúng phụ thuộc nhiều vàohình dạng của phân phối màu da Bên cạnh đó, hầu hết các phương pháp mô hình hóa màu

da có tham số đều bỏ qua những thống kê về màu không phải là tham số

3.2 Thuật toán xác định ảnh màu dựa trên màu da

3.2.1 Định vị vùng khuôn mặt người trong ảnh màu

Việc xác định vùng khuôn mặt người trong một bối cảnh là nhiệm vụ rất quan trọngtrong sinh trắc học Các phương pháp tiếp cận đang được sử dụng phổ biến hiện nay là:

Trang 15

Mạng Neural [24], Cascade of Classifiers [25], Các đặc trưng mẫu [85], Dựa trên màu da

(skin-color) [25][26], vv

Đối với ảnh màu, việc xác định vùng khuôn mặt người được thực hiện trong khônggian màu liên quan đến vùng chứa "da màu" xuất hiện trong không gian màu nền Mụcđích của phát hiện màu da là xây dựng một quy tắc có tính quyết định Đây là quy tắc sẽgiúp phân biệt một điểm ảnh là da hay không phải là da người Thông thường, quy tắc này

sẽ thiết lập một giá trị đo cho phép tính toán mức độ tương đồng giữa một điểm ảnh màuvới đặc trưng màu da Giá trị đo này được thiết lập như thế nào, công thức ra sao tùy thuộcvào từng phương pháp mô hình hóa màu da Các không gian màu thường được sử dụng làHSV, YCbCr và I1I2I3 [25,27]

Hình 3.1 Màu sắc hình ảnh và các thành phần R, G và B [25]

Việc xác định màu da được minh họa trong hình 3.1 với ảnh màu sử dụng khônggian màu RGB Rõ ràng ta có thể thấy, không ai trong số những người quay lưng lại cócác thành phần RGB được xác định rõ rang ngoại trừ vùng duy nhất xác định khu vực củakhuôn mặt người nhìn đối diện Trong [25], các tác giả đã đưa ra một ngưỡng lựa chọn đểxác định vị trí của khuôn mặt dựa trên màu da với mối quan hệ giữa 3 thành phần là R, G

và B có liên quan đến diện tích của khuôn mặt như sau:

R >> G > B và | RG |> 50

Ngày đăng: 25/10/2017, 13:47

HÌNH ẢNH LIÊN QUAN

Bảng 3.1 Kết quả nhận biết đúng và sai của các phương pháp - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Bảng 3.1 Kết quả nhận biết đúng và sai của các phương pháp (Trang 14)
Hình 3.1. Màu sắc hình ảnh và các thành phần R,G và B [25] - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.1. Màu sắc hình ảnh và các thành phần R,G và B [25] (Trang 15)
Hình 3.2. Các thành phần của ảnh gốc trong không gian màu HSV, YCbCr và I1I2I3 [25] - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.2. Các thành phần của ảnh gốc trong không gian màu HSV, YCbCr và I1I2I3 [25] (Trang 16)
3.2.2 Giai đoạn tiền xử lý hình ảnh ban đầu - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
3.2.2 Giai đoạn tiền xử lý hình ảnh ban đầu (Trang 18)
Hình 3.4. Bản gốc hình ảnh tại đầu vào phát hiện và mặt nạ thích hợp xác định các khu vực của mặt người - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.4. Bản gốc hình ảnh tại đầu vào phát hiện và mặt nạ thích hợp xác định các khu vực của mặt người (Trang 20)
Hình 3.5. Định nghĩa trung tâm của khuôn mặt - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.5. Định nghĩa trung tâm của khuôn mặt (Trang 21)
Hình 3.6. Ví dụ 1 về phân lớp của khuôn mặt Hình 3.7. Ví dụ 2 về phân lập của khuôn mặt - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.6. Ví dụ 1 về phân lớp của khuôn mặt Hình 3.7. Ví dụ 2 về phân lập của khuôn mặt (Trang 22)
Hình 3.9a. Các bước để xác định tọa độ của mắt trung tâm - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.9a. Các bước để xác định tọa độ của mắt trung tâm (Trang 23)
Trong hình 3.9a, khu vực phân tích khuôn mặt có khuôn mặt và độ dốc các dòng nang "X" của mắt được xác định từ các vị trí của tối đa, vị trí của các mắt trái và phải, trung tâm mắt tìm thấy - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
rong hình 3.9a, khu vực phân tích khuôn mặt có khuôn mặt và độ dốc các dòng nang "X" của mắt được xác định từ các vị trí của tối đa, vị trí của các mắt trái và phải, trung tâm mắt tìm thấy (Trang 23)
Hình 3.10. Cấu trúc hệ thống xác định và chuẩn hóa mặt người - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.10. Cấu trúc hệ thống xác định và chuẩn hóa mặt người (Trang 24)
Hình 3.11. Khuôn mặt trong cơ sở dữ liệu FERET[36] - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.11. Khuôn mặt trong cơ sở dữ liệu FERET[36] (Trang 26)
Hình 3.12. Kết quả phát hiện vị trí mặt người trong cơ sở dữ liệu FERET COLOR - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
Hình 3.12. Kết quả phát hiện vị trí mặt người trong cơ sở dữ liệu FERET COLOR (Trang 27)
Trong số 797 hình ảnh có 50 hình ảnh không phát hiện chính xác khuôn mặt với cơ sở dữ liệu FERET COLOR - Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da
rong số 797 hình ảnh có 50 hình ảnh không phát hiện chính xác khuôn mặt với cơ sở dữ liệu FERET COLOR (Trang 27)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w