1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đồ án: Xây dựng ứng dụng phát hiện khuôn mặt trong ảnh sử dụng OpenCV

61 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Ứng Dụng Phát Hiện Khuôn Mặt Trong Ảnh Sử Dụng OpenCV
Tác giả Cao Tiến Đạt
Người hướng dẫn TS. Ngụ Trường Giang
Trường học Trường Đại Học Dân Lập Hải Phòng
Chuyên ngành Công nghệ Thông tin
Thể loại Đồ án tốt nghiệp đại học
Năm xuất bản 2019
Thành phố Hải Phòng
Định dạng
Số trang 61
Dung lượng 1,43 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • CHƯƠNG 1: Tổng quan về phát hiện khuôn mặt (12)
    • 1.1 Giới thiệu phát hiện khuôn mặt (13)
    • 1.2 Các hướng tiếp cận trong phát hiện khuôn mặt (14)
      • 1.2.1 Hướng tiếp cận dựa trên tri thức (15)
      • 1.2.2 Hướng tiếp cận dựa trên đặc trưng không đổi (18)
      • 1.2.3 Hướng tiếp cận dựa trên so lớp mẫu (22)
      • 1.2.4 Hướng tiếp cận dựa trên máy học (25)
      • 1.2.5 Hướng tiếp cận tổng hợp (30)
    • 1.3 Khó khăn và thách thức trong bài toán phát hiện khuôn mặt (31)
    • 1.4 Một số lĩnh vực ứng dụng phát hiện khuôn mặt (32)
  • CHƯƠNG 2: Phát hiện khuôn mặt sử dụng đặc trưng Haar (12)
    • 2.1 Đặc trưng của Haar (33)
      • 2.1.1 Đối tượng nhận dạng (33)
      • 2.1.2 Đặc trưng (34)
    • 2.2 Bộ phân lớp AdaBoost (37)
      • 2.2.1 Giới thiệu (37)
      • 2.2.2 Các hướng tiếp cận dò tìm khuôn mặt nhanh (37)
      • 2.2.3 Thuật toán AdaBoost (38)
      • 2.2.4 Bộ phân lớp AdaBoost (43)
    • 2.3 Dò tìm khuôn mặt (46)
    • 2.4 Nhận xét (47)
      • 2.4.1 Ưu điểm (0)
      • 2.4.2 Nhược điểm (48)
  • CHƯƠNG 3: Thực nghiệm phát hiện khuôn mặt (49)
    • 3.1 Mô tả bài toán (49)
    • 3.2 Phát hiện khuôn mặt sử dụng hàm OpenCV (50)
      • 3.2.1 OpenCV là gì (50)

Nội dung

Đồ án: Xây dựng ứng dụng phát hiện khuôn mặt trong ảnh sử dụng OpenCV tài liệu, giáo án, bài giảng , luận văn, luận án,...

Tổng quan về phát hiện khuôn mặt

Giới thiệu phát hiện khuôn mặt

Trong những năm gần đây, nghiên cứu về bài toán xác định khuôn mặt người từ ảnh đã phát triển mạnh mẽ, từ ảnh đen trắng, xám đến ảnh màu Ban đầu, các bài toán chỉ đơn giản với một khuôn mặt nhìn thẳng và đầu ở tư thế thẳng đứng, nhưng không đáp ứng được nhu cầu cao trong cuộc sống hiện đại Do đó, đã có nhiều cải tiến trong việc phát hiện khuôn mặt người trong các môi trường phức tạp hơn, với nhiều khuôn mặt và tư thế khác nhau trong ảnh.

Xác định khuôn mặt người là một kỹ thuật quan trọng giúp xác định vị trí và kích thước khuôn mặt trong các bức ảnh Kỹ thuật này tập trung vào việc nhận diện các đặc trưng của khuôn mặt, đồng thời loại bỏ những yếu tố không liên quan.

Tổng quan kiến trúc của một hệ thống nhận dạng mặt người

Hệ thống nhận dạng khuôn mặt thường trải qua bốn bước chính: đầu tiên là phát hiện khuôn mặt, tiếp theo là phân đoạn khuôn mặt, sau đó là rút trích đặc trưng, và cuối cùng là phân lớp khuôn mặt.

Hình 1-1: Các bước chính trong một hệ thống nhận dạng mặt người

Phát hiện khuôn mặt là quá trình dò tìm và định vị các vị trí khuôn mặt trong ảnh hoặc video Phân đoạn khuôn mặt xác định vị trí của mắt, mũi, miệng và các thành phần khác, từ đó chuyển kết quả cho bước rút trích đặc trưng Thông tin về các thành phần này giúp tính toán véc-tơ đặc trưng, là dữ liệu đầu vào cho mô hình phân loại khuôn mặt đã được huấn luyện Ngoài các bước chính, việc áp dụng tiền xử lý và hậu xử lý có thể nâng cao độ chính xác của hệ thống Tuy nhiên, phát hiện khuôn mặt gặp nhiều khó khăn do các yếu tố như tư thế, độ sáng và điều kiện ánh sáng Trong luận văn này, tôi tập trung vào bước phát hiện khuôn mặt.

Các hướng tiếp cận trong phát hiện khuôn mặt

Nhiều nghiên cứu đã phát triển các phương pháp xác định khuôn mặt người, từ ảnh xám đến ảnh màu hiện đại Các phương pháp này được phân loại thành bốn hướng tiếp cận chính dựa trên các tính chất của chúng.

Hướng tiếp cận dựa trên tri thức liên quan đến việc mã hóa hiểu biết của con người về các loại khuôn mặt thành các quy tắc Những quy tắc này thường mô tả mối quan hệ giữa các đặc trưng của khuôn mặt.

Các thuật toán nhận diện khuôn mặt tập trung vào việc tìm kiếm các đặc trưng không thay đổi, nhằm mô tả cấu trúc khuôn mặt của con người Những đặc trưng này sẽ giữ nguyên bất chấp sự thay đổi về tư thế khuôn mặt, vị trí của thiết bị thu hình hoặc điều kiện ánh sáng.

Hướng tiếp cận dưa trên so khớp mẫu sử dụng các mẫu chuẩn của khuôn mặt người, được chọn lựa và lưu trữ, nhằm mô tả khuôn mặt và các đặc trưng của nó Các mẫu này cần được lựa chọn sao cho tách biệt theo tiêu chuẩn mà các tác giả đã định ra để phục vụ cho việc so sánh hiệu quả.

Hướng tiếp cận dựa trên diện mạo khác biệt so với khớp mẫu, khi các mô hình học được đào tạo từ một tập ảnh huấn luyện trước Hệ thống sẽ xác định khuôn mặt người dựa trên các đặc điểm hình ảnh Một số tác giả còn gọi phương pháp này là hướng tiếp cận theo phương pháp học.

1.2.1 Hướng tiếp cận dựa trên tri thức

Trong tiếp cận top-down, các luật xác định khuôn mặt người phụ thuộc vào tri thức của các tác giả nghiên cứu Các luật cơ bản có thể dễ dàng được xây dựng để mô tả các đặc trưng của khuôn mặt, chẳng hạn như hai đôi mắt đối xứng qua trục thẳng đứng, cùng với mũi và miệng Các mối quan hệ giữa các đặc trưng này có thể được mô tả qua khoảng cách và vị trí Thông thường, các tác giả sẽ trích xuất đặc trưng khuôn mặt trước, sau đó sử dụng các luật để xác định ứng viên nào là khuôn mặt và ứng viên nào không phải là khuôn mặt.

Một thách thức lớn trong việc chuyển đổi tri thức con người thành các quy tắc là làm sao thực hiện điều này một cách hiệu quả Nếu các quy tắc quá chi tiết, có thể dẫn đến việc bỏ sót những khuôn mặt trong ảnh, vì chúng không đáp ứng đủ các quy tắc đã đặt ra Ngược lại, nếu quy tắc quá tổng quát, có thể gây nhầm lẫn, xác định sai một vùng không phải là khuôn mặt thành khuôn mặt Hơn nữa, việc mở rộng yêu cầu để nhận diện các khuôn mặt ở nhiều tư thế khác nhau cũng gặp nhiều khó khăn.

Hình 1-2: (a) Ảnh ban đầu có độ phân giải n = 1; (b), (c), và (d) Ảnh có độ phân giải n = 4, 8, 16

Yang và Huang đã phát triển một phương pháp để xác định khuôn mặt, bao gồm ba mức luật Mức cao nhất sử dụng một khung cửa sổ quét trên ảnh để tìm các ứng viên có thể là khuôn mặt thông qua một tập luật Mức tiếp theo mô tả tổng quát hình dáng khuôn mặt, trong khi mức cuối cùng xem xét chi tiết các đặc trưng khuôn mặt Hệ thống này áp dụng đa độ phân giải để xác định khuôn mặt, với các luật ở mức cao nhất như: "Vùng trung tâm khuôn mặt có bốn phần với mức độ đều cơ bản" và "phần xung quanh bên trên của khuôn mặt có một mức độ đều cơ bản".

Mức độ khác nhau giữa các giá trị xám trung bình của phần trung tâm và phần bao bên trên là đáng kể Ở mức hai, biểu đồ của các ứng viên được xem xét để loại bỏ những ứng viên không phải là khuôn mặt và xác định cạnh bao xung quanh Cuối cùng, các ứng viên còn lại sẽ được phân tích các đặc trưng khuôn mặt như mắt và miệng Hai ông đã áp dụng chiến lược "từ thô đến mịn" để giảm thiểu số lượng tính toán trong quá trình xử lý Mặc dù tỷ lệ chính xác chưa cao, nhưng đây là nền tảng cho nhiều nghiên cứu sau này.

Hình 1-3: Một loại tri thức của người nghiên cứu phân tích trên khuôn mặt

Kotropoulos và Pitas đưa ra một phương pháp dùng trên độ phân giải thấp Hai ông dùng phương pháp chiếu để xác định các đặc trưng khuôn mặt

Kanade đã phát triển một phương pháp chiếu hiệu quả để xác định biên khuôn mặt Trong đó, I(x,y) đại diện cho giá trị xám của một điểm trong ảnh có kích thước m x n tại vị trí (x,y) Các hàm chiếu ảnh theo phương ngang và thẳng đứng được định nghĩa rõ ràng để hỗ trợ quá trình này.

HI( x )  ny1 I ( x , y ) và VI(y)  mx1 I(x, y) (1-1)

(a) Ảnh chỉ có một khuôn mặt và hình nền đơn giản;

(b) Ảnh chỉ có một khuôn mặt và hình nền phức tạp;

(c) Ảnh có nhiều khuôn mặt

Dựa trên biển đồ chiếu hình ngang, có hai cực tiểu cục bộ khi xét quá trình thay đổi độ dốc HI, tương ứng với cạnh bên trái và phải của hai đầu Tương tự, hình chiếu dọc VI cũng cho thấy các cực tiểu cục bộ, giúp xác định vị trí miệng, đỉnh mũi và hai mắt Những đặc trưng này đủ để xác định khuôn mặt.

Cách xác định khuôn mặt trong hình 1.4.a đạt tỷ lệ chính xác 86,5% khi chỉ có một khuôn mặt thẳng và hình nền đơn giản Tuy nhiên, với hình nền phức tạp như trong hình 1.4.b, việc xác định trở nên khó khăn Đặc biệt, trong trường hợp có nhiều khuôn mặt như hình 1.4.c, hệ thống không thể thực hiện xác định chính xác.

Hình 1-5: Chiếu từng phần ứng viên để xác định khuôn mặt

Mateos và Chicote dùng kết cấu để xác định ứng viên trong ảnh màu

Phân tích hình dáng, kích thước và thành phần khuôn mặt giúp xác định khuôn mặt một cách chính xác Hai ông đã trích xuất các ứng viên cho từng thành phần khuôn mặt và chiếu từng phần để xác thực tính chính xác Tỷ lệ chính xác đạt hơn 87%.

Berbar sử dụng mô hình màu da người và xác định cạnh để nhận diện các ứng viên khuôn mặt Sau đó, các đặc trưng được kết hợp và chiếu các ứng viên xuống hệ trục tọa độ nhằm xác định khuôn mặt thực sự.

1.2.2 Hướng tiếp cận dựa trên đặc trưng không đổi Đây là hướng tiếp cận thiểu kiểu bottom-up Các tác giả cố gắng tìm các đặc trưng không thay đổi của khuôn mặt người để xác định khuôn mặt người

Khó khăn và thách thức trong bài toán phát hiện khuôn mặt

Việc xác định khuôn mặt người có những khó khăn nhất định:

Hướng của khuôn mặt khi chụp ảnh rất quan trọng, bao gồm các tư thế như nhìn thẳng, nhìn nghiêng hoặc nhìn từ trên xuống Trong một bức ảnh, có thể xuất hiện nhiều khuôn mặt với các tư thế khác nhau, tạo nên sự đa dạng và phong phú cho bức hình.

 Sự có mặt của các chi tiết không phải là đặc trưng riêng của khuôn mặt người, như: râu quai nón, mắt kính, …

 Các nét mặt (facial expression) khác nhau trên khuôn mặt, như: vui, buồn, ngạc nhiên, …

 Mặt người bị che khuất bởi các đối tượng khác có trong ảnh

 Điều kiện ảnh, đặc biệt là về độ sáng và chất lượng ảnh, chất lượng thiết bị thu hình

 Trục toạ độ của máy ảnh so với ảnh

 Kích thước khác nhau của các khuôn mặt người, và đặc biệt là trong cùng một ảnh

 Nhiều khuôn mặt có vùng da dính lẫn nhau

Các khó khăn này cho thấy rằng mọi thuật toán giải quyết bài toán xác định khuôn mặt người đều không thể tránh khỏi một số khiếm khuyết nhất định Để đánh giá và so sánh các phương pháp xác định khuôn mặt, người ta thường dựa vào các tiêu chí cụ thể.

Tỷ lệ xác định chính xác là tỷ lệ giữa số lượng khuôn mặt người được nhận diện đúng bởi hệ thống và tổng số khuôn mặt thực sự có trong các bức ảnh.

 Số lượng xác định nhầm là số lượng vùng trong ảnh không phải là khuôn mặt người mà hệ thống xác định nhầm là khuôn mặt người (false positives).

 Thời gian thực hiện là thời gian để máy tính xác định khuôn mặt người trong ảnh (running time).

Phát hiện khuôn mặt sử dụng đặc trưng Haar

Đặc trưng của Haar

Trên ảnh, khuôn mặt được xác định bởi các điểm ảnh có mối quan hệ đặc biệt, tạo nên những đặc trưng riêng biệt Khi chuyển sang ảnh xám, tất cả khuôn mặt người đều thể hiện những đặc điểm chung.

 Vùng hai mắt sẽ tối hơn vùng má và vùng chán, tức mức xám của vùng này cao hơn vượt trội so với hai vùng còn lại

 Vùng giữa sống mũi cũng tối hơn vùng hai bên mũi

Và còn rất nhiều những đặc điểm khác của khuôn mặt và các đặc trưng Haar like dựa vào các đặc điểm này để nhận dạng

Các đặc trưng Haar-like không chỉ được áp dụng trong nhận dạng khuôn mặt mà còn có thể nhận diện nhiều đối tượng khác như thân người, tay, chân, ô tô và đồ vật Mỗi đối tượng đều có những đặc điểm riêng biệt được thể hiện qua các vùng điểm ảnh, và đặc trưng Haar-like thực hiện việc tính toán các giá trị tương quan giữa các vùng ảnh này Đây là bước khởi đầu trong việc áp dụng đặc trưng để phân loại cửa sổ con, trong khi chi tiết về phân loại của bộ Adaboost và Cascade of Classifiers sẽ được trình bày ở phần sau.

Các đặc trưng Haar-Like là những hình chữ nhật được phân thành các vùng khác nhau như hình:

Hình 2-1 trình bày bốn đặc trưng cơ bản do Viola và Jones công bố để nhận diện khuôn mặt người Mỗi đặc trưng Haar-Like được tạo thành từ sự kết hợp của hai hoặc ba hình chữ nhật màu trắng hoặc đen.

Để xác định khuôn mặt người, bốn đặc trưng Haar-like cơ bản được mở rộng và phân chia thành ba tập đặc trưng, trong đó có đặc trưng cạnh (edge feature).

Hình 2-3: Đặc trưng đường(line feature)

Hình 2-4: Đặc trưng xung quanh tâm(center-surround features)

Hình 2-5: Các đặc trưng mở rộng của các đặc trưng Haar-like cơ sở

Sử dụng các đặc trưng đã nêu, chúng ta có thể tính toán giá trị của đặc trưng Haar-Like, được xác định bởi sự chênh lệch giữa tổng số pixel của vùng đen và vùng trắng, như được thể hiện trong công thức sau:

(2-1) Viola và Joines đưa ra một khái niệm gọi là Integral Image, là một mảng

2 chiều với kích thước bằng với kích thước của ảnh cần tính đặc trưng Haar-

Like, với mỗi phần tử của mảng này được tính bằng cách tính tổng của điểm ảnh phía trên (dòng-1) và bên trái (cột-1) của nó

Hình 2-6: Công thức tính Intergral Image

Sau khi tính toán được Hình ảnh Tích phân, việc tính tổng các giá trị mức xám trong một vùng bất kỳ trên ảnh trở nên rất đơn giản.

Giả sử ta cần tính tổng giá trị mức xám của vùng D như hình dưới, ta có thể tính được như sau:

Tại điểm P4 trên Hình ảnh Tích phân, giá trị được xác định là A + B + C + D Tương tự, giá trị tại điểm P2 là A + B, tại điểm P3 là A + C, và tại điểm P1 là A Do đó, biểu thức tính D có thể được viết lại như sau:

Hình 2-7: Ví dụ cách tính nhanh các giá trị mức xám của vùng D trên ảnh

Để chọn các đặc trưng Haar-like cho việc thiết lập ngưỡng, Viola và Jones đã áp dụng phương pháp máy học AdaBoost Phương pháp này kết hợp các bộ phân loại yếu để tạo thành một bộ phân loại mạnh Bộ phân loại yếu chỉ có khả năng đưa ra câu trả lời chính xác hơn một chút so với việc đoán ngẫu nhiên, trong khi bộ phân loại mạnh có thể đạt độ chính xác trên 60%.

Bộ phân lớp AdaBoost

Bài toán dò tìm khuôn mặt nhanh trên ảnh là rất quan trọng, vì quá trình nhận dạng đối tượng sẽ không chính xác nếu thiếu bước dò tìm và định vị Việc này có ý nghĩa lớn trong nhận dạng và theo dõi các đối tượng chuyển động trong video hoặc camera.

2.2.2 Các hướng tiếp cận dò tìm khuôn mặt nhanh

Hướng dò tìm khuôn mặt trên ảnh màu dựa vào phân tích màu sắc của vùng da có thể xử lý nhanh chóng, nhưng chỉ áp dụng cho ảnh màu và nhạy cảm với ánh sáng Phương pháp này thường được sử dụng như bước tiền xử lý cho các phương pháp khác.

Phương pháp dò tìm khuôn mặt dựa trên các đặc trưng bất biến của khuôn mặt người đã đạt được nhiều thành công, trong đó nổi bật nhất là phương pháp ASM (Active Shape Models) trong việc nhận diện khuôn mặt người trong thời gian thực.

Phương pháp dò tìm khuôn mặt dựa trên thông tin hình ảnh sử dụng các kỹ thuật như mạng nơ-ron và các hướng thống kê như SVM và AdaBoost Mặc dù SVM và mạng nơ-ron đạt được kết quả cao trong thời gian nhanh, nhưng chỉ có thể xử lý vài ảnh mỗi giây, điều này hạn chế khả năng áp dụng trong nhận diện thời gian thực Trong khi đó, phương pháp AdaBoost cho kết quả khả quan nhất, với khả năng xử lý khoảng 15-20 khung hình mỗi giây.

Trong bài toán hai lớp, mẫu huấn luyện bao gồm M bộ (xi, yi) đã được gán nhãn, với yi thuộc {+1, -1} và xi thuộc Rn AdaBoost xây dựng một bộ phân loại mạnh hơn thông qua sự kết hợp tuyến tính giữa M bộ phân loại yếu hơn.

Các bộ phân loại yếu hơn có thể mang các giá trị thực, 𝒉 𝒎 (x) 𝝐 R Phân loại của x được quyết định bằng hàm H(x) = sign[𝑯 𝑴 (x)], trong đó độ lớn

Độ tin cậy của mô hình được thể hiện qua hàm 𝑯 𝑴 (x), trong đó mỗi mẫu được gán một trọng số Trong quá trình học, các trọng số này được cập nhật để nhấn mạnh các phân loại sai trước đó Tuy nhiên, với các thuật toán AdaBoost cải tiến gần đây, việc cập nhật trọng số có thể được thay thế bằng một hàm tối ưu hóa Lỗi xảy ra khi H (x) không bằng y hoặc y𝑯 𝑴 (x) nhỏ hơn 0 Mặt khác, lề của mẫu (x, y) qua hàm h(x) 𝝐 R trên tập mẫu huấn luyện được định nghĩa là yh(x), và lề này có thể được coi là thước đo độ tin cậy của giá trị dự đoán của h Lỗi phân lớp của 𝑯 𝑴 có biên trên là một yếu tố quan trọng trong việc đánh giá hiệu suất của mô hình.

Thuật toán AdaBoost xây dựng hàm h(x) bằng cách giảm tối đa (2-6).

H M (x) tốt nhất cho phân loại mạnh 𝑯 𝑴 (x) = 𝑯 𝑴−𝟏 (𝒙) + 𝒉 𝒎 (𝒙)

Là hàm dẫn tới giá trị nhỏ nhất:

8) và hàm có giá trị nhỏ nhất được chứng minh là:

9) Với là 𝝎 (𝑴−𝟏) trọng lượng tại thời điểm M

Dùng công thức P(y| x,ω) = P(x| y,ω) P(y) và cho

Chúng ta có được 𝑯 𝒎 (x) = 𝑳 𝒎 (x) – T 𝑳 𝒎 được học ra từ các mẫu của cả hai phân lớp Ngưỡng T được xác định bằng tỉ lệ log của các xác suất trước đó

Chúng tôi đã phát triển một phương pháp để tính toán phương trình (2-11), đặc biệt hữu ích trong việc học các bộ phân lớp tối ưu Việc rút ra một bộ phân loại yếu trong không gian nhiều chiều là rất quan trọng, vì vậy chúng tôi giới thiệu một mô hình thống kê theo từng giai đoạn dựa trên các đặc điểm vô hướng Một đặc điểm vô hướng j của x được tính thông qua một phép biến đổi từ không gian dữ liệu n chiều thành đường thẳng thực 𝒁 𝒋 (x) thuộc Z Đặc điểm này có thể là hệ số hoặc trong xử lý ảnh, được hiểu là phép biến đổi vi ba tín hiệu Nếu phương pháp tìm kiếm ước lượng được áp dụng, phép biến đổi 𝒁 𝒋 (x) sẽ được coi là tọa độ thứ j của x Chúng tôi có thể tạo ra một danh sách K đặc điểm ứng cử viên Z = {𝒁 𝒋 (x), …, 𝒁 𝒌 (x)} Trong phần tiếp theo, chúng tôi sử dụng z(m) để biểu diễn đặc điểm được chọn trong giai đoạn m, trong khi 𝒁 𝒌 (x) là đặc điểm được tính toán từ x thông qua phép biến đổi thứ k.

Giả sử Z là một tập rất hoàn chỉnh, các phân lớp yếu có thể có cho bài toán phân lớp yếu tối ưu được thiết lập như sau: Trước tiên, tại giai đoạn

M, khi M-1 đặc điểm của 𝒁 (𝟏) , 𝒁 (𝟐) , …, 𝒁 (𝒎−𝟏) đã được chọn và trọng lượng số cho là 𝝎 (𝑴−𝟏) , chúng ta xấp xỉ p(x|y,𝝎 (𝑴−𝟏) )) bằng cách dùng phân bố của M đặc điểm: p(x|y, 𝝎 (𝑴−𝟏) ) ≈ p(z (1) , z (2) , …,𝒁 (𝑴−𝟏) ), 𝒁 𝒌 , |y, 𝝎 (𝑴−𝟏) ) (2-

Bởi vì Z là tập rất hoàn chỉnh, phép xấp xỉ vẫn tốt đối với tập M đủ lớn khi M đặc điểm được chọn thích hợp

Ghi chú rằng xác suất có điều kiện p(𝒁 𝒎 |y, 𝒁 (𝟏) , 𝒁 (𝟐) , …, 𝒁 (𝒎−𝟏) ) thực chất là p(𝒁 𝒎 |y, 𝝎 (𝑴−𝟏) ) vì 𝝎 (𝑴) chứa thông tin về toàn bộ quá trình tạo ω và bao gồm các thành phần phụ thuộc vào 𝒁 (𝟏) , 𝒁 (𝟐) , …, 𝒁 (𝒎−𝟏) Do đó, ta có thể viết rằng p(x|y, 𝝎 (𝑴−𝟏) ) gần bằng tích các xác suất p(z (1) | y, 𝝎 (𝟎) ), p(𝒛 (𝟐) | y, 𝝎 (𝟏) ), …, p(𝒁 (𝑴−𝟏) | y, 𝝎 (𝑴−𝟐) ) và p(z k | y, 𝝎 (𝑴−𝟏) ).

Mật độ xác suất p(𝒁 𝒌 | y, 𝝎 (𝑴−𝟏)) cho các phân lớp dương (y = +1) và âm (y = -1) có thể được ước lượng từ histogram, được tính toán thông qua việc đánh giá công nhận trọng số của các ví dụ huấn luyện với trọng số 𝝎 (𝑴−𝟏).

15) chúng ta rút ra được tập hợp các phân lớp yếu hơn như sau: Ί (𝑴) (𝒙) = 𝒉 𝒌 (𝑴) (𝒙)|∀𝒌 (2-16)

N = a + b; a là số mẫu thuộc phân lớp 𝒚 𝒊 = +1 b là số mẫu thuộc phân lớp 𝒚 = -1

2 Số lớp yếu tối đa M max được kết hợp Bước 1: Khởi tạo

𝟐𝒂 với mẫu thuộc phân lớp 𝒚 𝟏 =+1

𝟐𝒂 với mẫu thuộc phân lớp 𝒚 𝟏 = -1

2) Chọn Hm theo biểu thức (2-8)

3) Cập nhật 𝝎 𝒊 (𝒎) ← exp −𝒚 𝒊 𝑯 𝒎 𝒙 (𝒊) và chuẩn hóa 𝝎 𝒊 (𝒎) để ∑ 𝝎 𝒊 (𝒎) = 𝟏 Bước 3: Đầu ra

Hình 2-8: Ví dụ minh họa cho thuật toán AdaBoost

Bằng cách sử dụng bộ dò tìm c được huấn luyện qua phương pháp AdaBoost, chúng ta có thể đạt được độ chính xác và tốc độ dò tìm nhất định Tuy nhiên, để nâng cao độ chính xác, bộ dò tìm cần phải tích hợp nhiều đặc trưng, điều này sẽ dẫn đến việc giảm tốc độ dò tìm.

Sử dụng bộ dò tìm kết hợp F={𝑪 𝒊 } với nhiều bộ dò tìm cơ bản fi có thể dẫn đến tình trạng giảm độ chính xác Để đạt được độ chính xác cao, cần có số lượng lớn bộ dò tìm hoặc mỗi bộ cần nhiều đặc trưng, điều này làm giảm tốc độ Một giải pháp là áp dụng bộ dò tìm phân tầng T={𝒕 𝒊 }, bao gồm nhiều tầng với các bộ dò tìm khác nhau, giúp cải thiện tốc độ và độ chính xác khi dò tìm khuôn mặt trong ảnh.

Mỗi kích thước s của tập hợp 𝑾 𝟎 ={𝒘 𝒊,𝒋,𝒔 } tại các tọa độ (i,j) sẽ được kiểm tra để xác định xem có phải là mặt người hay không Qua từng tầng ti, 𝑾 𝒊 = 𝒕 𝒊 (𝑾 𝒊−𝟏 ) với |𝑾 𝒊 |

Ngày đăng: 04/07/2023, 10:32

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w