Ngủ gật là hành vi do sự mệt mỏi của cơ thể, có biểu hiện đầu gục xuống giống như tư thế cúi gằm mặt, mắt lim dim trong giây lát, rồi bất chợt tỉnh lại; trong khoảng thời gian ngắn ngủi
Trang 1MỞ ĐẦU
1 Phát biểu vấn đề và mục tiêu nghiên cứu
Tai nạn giao thông là một vấn nạn đe dọa nghiêm trọng tính mạng con người, không chỉ là vấn nạn ở Việt Nam ta mà là một hiện tượng mang tính toàn cầu Nhiều nghiên cứu trên thế giới cho thấy rằng một trong những nguyên nhân chính gây ra tai nạn giao thông là do lái xe ngủ gật Ngủ gật là hành vi do sự mệt mỏi của cơ thể, có biểu hiện đầu gục xuống giống như tư thế cúi gằm mặt, mắt lim dim trong giây lát, rồi bất chợt tỉnh lại; trong khoảng thời gian ngắn ngủi ấy, cơ thể rơi vào trạng thái vô thức, tài xế mất đi khả năng điều khiển xe, chạy không ổn định, lấn làn; và lái xe không kịp phản xạ để tránh tình huống nguy hiểm khi tới gần chướng ngại vật hoặc phương tiện giao thông khác
Hiện nay, việc sử dụng các hệ thống trợ giúp theo dõi mức độ cảnh giác của lái xe và cảnh báo lái xe lúc mệt mỏi, ngủ gật được đặc biệt quan tâm nhằm giảm thiểu vấn nạn này Tuy nhiên, việc phát hiện lái xe ngủ gật gặp khó khăn khi mặt người trong tình trạng nghiêng so với camera thu nhận Ngoài ra, trạng thái lắc lư của xe hay chớp mắt của lái
xe càng gây khó khăn cho việc giải quyết bài toán này
Do đó, để góp phần làm giảm thiểu tai nạn giao thông do tình trạng
ngủ gật của lái xe, tác giả chọn nghiên cứu đề tài “Phát triển một số kỹ thuật phát hiện lái xe ngủ gật dựa trên trạng thái mắt và hành vi gật lắc” để thực hiện Luận án này bởi vì một hệ thống phát hiện buồn ngủ
hiệu quả và thân thiện có thể giúp dành lại cuộc sống cho nhiều người
và làm cho thế giới trở thành một nơi tốt hơn để sống
Mục tiêu của Luận án này là phát triển một số kỹ thuật phát hiện hỗ trợ đánh thức lái xe trong trạng thái ngủ gật dựa trên nền tảng các kỹ thuật thị giác máy tính
2 Các công trình liên quan
Gần đây, các phương pháp phát hiện buồn ngủ sử dụng trí tuệ nhân tạo đã và đang được nhiều nhà nghiên cứu đặc biệt quan tâm nhằm tích hợp cơ chế tự động phát hiện ngủ gật và cảnh báo lái xe, ngăn ngừa tai nạn xảy ra Các phương pháp phát hiện được chia thành ba nhóm chính: (1) Dựa vào phương tiện; (2) Dựa vào hành vi của lái xe; và (3) Dựa vào
Trang 2sinh lý của lái xe
a) Phương pháp dựa vào phương tiện
Các phương pháp thuộc loại này sử dụng các cảm biến đặt ở các thành phần của xe như vô-lăng, bàn đạp ga để đo lường một số đại lượng như: độ lệch khỏi vị trí làn đường, khoảng cách giữa xe của lái xe và xe trước nó, chuyển động của vô-lăng, áp lực lên bàn đạp ga, v.v Các đại lượng này được giám sát một cách liên tục để có thể thực hiện cảnh báo khi có sự thay đổi nào vượt ngưỡng cho phép Tuy nhiên, chúng phụ thuộc chất lượng đường, ánh sáng, và chỉ có thể hoạt động tốt trong các tình huống hạn chế Và, các hệ thống này không thể phát hiện được sự buồn ngủ khi nó chưa ảnh hưởng đến tình trạng của xe
b) Phương pháp dựa vào tín hiệu sinh lý của lái xe
Nhóm này sử dụng các tín hiệu điện não đồ (EEG) và điện tâm đồ (ECG) để phát hiện buồn ngủ; trong đó, ECG là tín hiệu sinh lý được sử dụng phổ biến nhất Ngoài ra, nhịp tim và độ biến thiên nhịp tim cũng thường được sử dụng để phát hiện buồn ngủ
c) Phương pháp dựa vào hành vi của lái xe
Các phương pháp thuộc nhóm này sử dụng ánh sáng hồng ngoại (IR)
và ánh sáng ban ngày trong các hệ thống giám sát gương mặt bằng cách ghi lại những hình ảnh từ vẻ mặt của người lái xe và chiết xuất ra các triệu chứng của sự mệt mỏi và mất tập trung từ mắt, miệng và đầu như:
tỷ lệ phần trăm đóng mí mắt theo thời gian (PERCLOSE), khoảng cách
mí mắt tỷ lệ chớp mắt, tốc độ chớp mắt, hướng ánh mắt, sự chuyển động đột ngột của mắt, ngáp, gật đầu, hướng đầu, v.v… do đó, chúng không gây khó chịu hay xáo trộn nào đối với lái xe
3 Đối tượng, phạm vi và phương pháp nghiên cứu
a) Đối tượng nghiên cứu của Luận án: trạng thái (hành vi) ngủ gật,
dựa trên trạng thái mắt và hành vi gật lắc đầu của lái xe
b) Phạm vi nghiên cứu: đầu vào là ảnh đã tiền xử lý và phương pháp
xử lý là trên cơ sở thị giác máy tính
c) Phương pháp: Để phát hiện lái xe buồn ngủ, Luận án đề xuất thuộc
nhóm dựa vào trạng thái lái xe sử dụng thị giác máy tính Các kỹ thuật phát hiện buồn ngủ được phát triển trong Luận án này bao gồm:
Trang 3• Kỹ thuật dựa vào trạng thái mắt;
• Kỹ thuật dựa vào hành vi gật lắc đầu;
• Kỹ thuật kết hợp dựa vào trạng thái mắt và hành vi gật lắc
Việc phát triển kỹ thuật dựa trên hành vi gật lắc cần có phương pháp ước lượng hướng đầu Phương pháp ước lượng hướng đầu đề xuất trong Luận án được thiết kế dựa trên kỹ thuật xác định vị trí khuôn mặt người, kết hợp với giải thuật Mô hình ngoại quan tích cực (Active Appearance Model - AAM) và Mô hình pháp tuyến khuôn mặt Khi ngủ gật thì hướng đầu thường ở trạng thái nghiêng, tức là khuôn mặt không thẳng với camera thu nhận Đây là một vấn đề thách thức cần được giải quyết mới có thể phát hiện ngủ gật một cách hiệu quả Để giải quyết vấn đề này, Luận án đề xuất việc kết hợp kỹ thuật ước lượng hướng đầu dựa trên Mô hình pháp tuyến khuôn mặt
Luận án này đề xuất kỹ thuật phát hiện lái xe ngủ gật bằng cách kết hợp hai kỹ thuật: dựa vào trạng thái mắt và dựa vào hành vi gật lắc Kỹ thuật kết hợp này được thực hiện sau khi xác định được mối quan hệ giữa các yếu tố như trạng thái mắt, hành vi gật lắc và trạng thái ngủ gật bằng cách phân tích thống kê dùng mô hình hồi qui tuyến tính và hồi qui logistic nhị phân Hệ thống tích hợp kỹ thuật kết hợp này của Luận án
có thể phát hiện chính xác cao trạng thái ngủ gật của lái xe
4 Bố cục của Luận án
Ngoài phần Mở đầu giới thiệu chung và phần Kết luận về đề tài nghiên cứu, nội dung chính của Luận án này được trình bày trong 4 chương:
• Chương 1 – Tổng quan
• Chương 2 – Kỹ thuật phát hiện trạng thái mắt và ngủ gật
• Chương 3 – Kỹ thuật phát hiện hành vi gật lắc và trạng thái ngủ gật;
• Chương 4 – Hệ thống tích hợp phát hiện lái xe trong trạng thái ngủ gật;
Trang 4CHƯƠNG 1 – CƠ SỞ LÝ THUYẾT VỀ KỸ THUẬT
PHÁT HIỆN LÁI XE NGỦ GẬT 1.1 Tổng quan về kỹ thuật phát hiện lái xe ngủ gật
1.1.1 Sinh lý giấc ngủ và hành vi ngủ gật
Ngủ là tình trạng cơ thể nghỉ ngơi, tự tu bổ để phục hồi Ngủ đầy đủ đem lại cảm giác khoẻ mạnh sảng khoái vào buổi sáng, đầu óc minh mẫn, sáng suốt Ngược lại, thiếu ngủ làm ta cảm thấy mệt mỏi, dễ nhầm lẫn, trí nhớ kém, trở nên khó chịu, cáu gắt, năng suất làm việc kém, quan hệ với người chung quanh cũng trở nên khó khăn Đặc biệt là sự xuất hiện của hành vi ngủ gật
Theo quan điểm sinh lý học và tâm lý học, các khái niệm của sự mệt mỏi và buồn ngủ là khác nhau, nhưng trong cơ sở lý thuyết liên quan trong lĩnh vực công nghệ thông tin, mệt mỏi và buồn ngủ là những thuật ngữ đồng nghĩa Cho tới nay, chưa có một định nghĩa chính xác và khoa học nào cho khái niệm “sự mệt mỏi”; do đó, không có bất kỳ tiêu chí định lượng để đo lường nó Tuy vậy, nhiều nghiên cứu đã chỉ ra mối liên
hệ giữa sự mệt mỏi/buồn ngủ và nhiệt độ cơ thể, mắt chuyển động, nhịp thở, nhịp tim và hoạt động của não, và có mối quan hệ chặt chẽ giữa mệt mỏi và tỷ lệ đóng mắt, v.v
a) Các phương pháp dựa vào phương tiện
Một vài đại lượng đo lường như độ lệch khỏi vị trí làn đường, chuyển động của vô-lăng, áp lực trên bàn đạp tăng tốc, v.v được giám sát một cách liên tục Bất kỳ sự thay đổi nào vượt ngưỡng cho phép sẽ báo hiệu khả năng xảy ra tình trạng lái xe ngủ gật
b) Các phương pháp dựa vào hành vi
Trang 5Các hành vi của lái xe như ngáp, đóng cửa mắt, mắt nhấp nháy, đầu nghiêng, v.v được giám sát thông qua một máy ảnh và chương trình điều khiển sẽ có tín hiệu cảnh báo nếu bất cứ triệu chứng buồn ngủ được phát hiện
c) Các phương pháp dựa vào sinh lý
Buồn ngủ được phát hiện thông qua xung nhịp mạch máu, nhịp tim
và thông tin điện não Các kỹ thuật cơ bản thường được dùng trong việc phát hiện buồn ngủ gồm có: ECG & EEG, Chuyển động của vô-lăng,
Kỹ thuật quang học, và Kỹ thuật thống kê
1.1.3 Các bài toán liên quan đến phát hiện ngủ gật
Trong phạm vi nghiên cứu của đề tài, Luận án xem xét hai kỹ thuật chính: (1) nhận dạng trạng thái mắt; và (2) phát hiện hành vi gật lắc Để thực hiện được hai kỹ thuật đó, Luận án cần xem xét đến hai bài toán liên quan như: (1) phát hiện khuôn mặt; và (2) phát hiện mắt Các bài toán này liên hệ với nhau trong hệ thống phát hiện lái xe trong trạng thái ngủ gật như Hình 2.1
Trang 6Hình 2.1: Hệ thống nhận dạng trạng thái ngủ gật
Hình ảnh đầu vào được thu nhận qua một trong các loại camera: (1) loại camera ống chuẩn CCIR; (2) loại camera số hoá; (3) loại camera quét dòng Chất lượng của ảnh phụ thuộc nhiều vào chất lượng camera, môi trường xung quanh (ánh sáng, sự vật, thời gian, v.v )
Sau khi được thu nhận, hình ảnh sẽ được đưa vào bộ tiền xử lý để nâng cao chất lượng nhằm giúp cho việc tìm kiếm các đặc trưng yêu cầu được dễ dàng hơn và chính xác hơn Trong giai đoạn tiền xử lý, kích cỡ giữa ảnh trong cơ sở dữ liệu và ảnh cần tìm cũng như vị trí, tư thế ảnh mặt sẽ được chuẩn hóa, độ sáng/tối của ảnh cũng được hiệu chỉnh phù hợp; nhiễu sẽ được lọc tối đa, v.v
Trích chọn đặc trưng là kỹ thuật sử dụng các thuật toán để lấy ra những thông tin cơ bản của mặt người để hệ thống có thể phát hiện chính xác đâu là mặt người trong ảnh Sau khi phát hiện được khuôn mặt người, Luận án sẽ xác định vị trí mắt thông qua bài toán phát hiện mắt người trong ảnh cũng như xác định được trạng thái đóng/mở của mắt Cũng từ trạng thái mắt đã được xác định, Luận án có thể thiết lập các thông số liên quan để xác định xem lái xe có rơi vào tình trạng ngủ gật hay không Đồng thời, hệ thống sẽ xác định hướng mặt của lái xe để phát hiện hành
vi gật lắc Hệ thống sẽ đưa ra cảnh báo tình trạng ngủ gật khi một trong
ba tình huống sau xảy ra:
• Mắt rơi vào trạng thái ngủ gật bất kể sự thay đổi của hướng mặt;
• Có sự thay đổi hướng mặt đột ngột trong khi mắt vẫn trong trạng thái mở; điều này xảy ra khi lái xe rơi vào trạng thái “ngủ trong ruột”;
• Việc kết hợp trạng thái mắt và hành vi gật lắc đạt đến một ngưỡng được đặt ra cho việc xác định trạng thái ngủ gật
1.2 Một số vấn đề lý thuyết cơ sở
1.2.1 Nhận dạng mẫu
Tất cả các đối tượng (phần tử) có cùng chung một số tính chất đặc trưng điển hình và được nhóm lại thành các “lớp” Các tính chất đặc trưng đó được thể hiện thông qua một phần tử đại diện để phản ánh các phần tử khác trong lớp đó, được gọi là “mẫu” Vậy, “nhận dạng” chính
Trang 7là quá trình phân loại các đối tượng được biểu diễn theo một mơ hình nào đĩ và gán chúng một tên dựa theo những quy luật và mẫu chuẩn
1.2.2 Các bước cơ bản trong xây dựng hệ nhận dạng
Hệ nhận dạng trong khoa học máy tính được thực hiện trên một số bước cơ bản như: (1) mã hĩa mỗi đại lượng vật lý đo được từ một đối tượng cần được nhận dạng thành một bộ các dấu hiệu đặc trưng cho dạng
và dạng sẽ được đồng nhất với một bộ các dấu hiệu đặc trưng cho chúng; (2) Sau khi dạng được mã hĩa, lựa chọn các dấu hiệu đặc trưng điển hình, loại bỏ các dấu hiệu phụ để giảm bớt kích thước của dạng cũng như mức độ phức tạp trong tính tốn; (3) Đánh giá các thơng số đặc trưng của dạng để cĩ thể xác định dạng của đối tượng trước khi tiến hành
so khớp để nhận dạng chính xác
1.2.3 Các khái niệm cơ sở
a) Khơng gian biểu diễn dạng (X): là tập hợp các dạng cĩ thể cĩ (cĩ thể
là hữu hạn hoặc vơ hạn) của đối tượng
b) Khơng gian diễn dịch: là tập hợp các tên gọi của các dạng được xác
định trong khơng gian biểu diễn dạng
c) Bài tốn nhận dạng: Từ hai khái niệm trên, ta cĩ thể biểu diễn tốn
học của bài tốn nhận dạng như sau: :f X → Ω; trong đĩ, ánh xạ f là tập hợp các quy luật, tiêu chuẩn để xác định một phần tử thuộc X ứng
với một phần tử Ω
1.2.4 Các phương pháp học trong nhận dạng
a) Học cĩ giám sát (Supervised learning): Đây là kỹ thuật phân loại nhờ
kiến thức biết trước được thể hiện qua một thư viện các mẫu chuẩn Mẫu cần nhận dạng sẽ được đem so sánh với mẫu chuẩn để xem nĩ thuộc loại nào Vấn đề chủ yếu là thiết kế một hệ thống để cĩ thể đối sánh đối tượng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một cơng cụ gọi là hàm phân lớp hay hàm ra quyết định Các phương pháp thuộc nhĩm này gồm cĩ: Support Vector Machine; K Nearest Neighbours; Nạve Bayes; Decision Tree; Neural Network; Centroid–base vector; hay Linear Least Square Fit – LLSF, v.v
b) Học khơng cĩ giám sát (Unsupervised learning): Kỹ thuật này phải
Trang 8tự định ra các lớp khác nhau và xác định các tham số đặc trưng cho từng lớp bằng cách gộp mọi nhóm có thể và chọn lựa cách tốt nhất Bắt đầu
từ tập dữ liệu, nhiều thủ tục xử lý khác nhau nhằm phân lớp và nâng cấp dần để đạt được một phương án phân loại tốt nhất Một số phương pháp thuộc nhóm học này gồm có K-means, HAC, DBSCAN, SOM (Self-Organizing Map), FCM, v.v
c) Học bán giám sát (Semi-supervised learning): Kỹ thuật này kết hợp
những ưu điểm của hai phương pháp học trước: học có giám sát và học không có giám sát nhằm tăng độ chính xác cho quá trình nhận dạng Theo đó, kỹ thuật này dùng một thuật toán để học các dạng trong mẫu chuẩn, sau đó tiến hành gán nhãn cho một số dạng mới sau quá trình có lựa chọn một cách hợp lý Tiếp theo, chuyển những dạng mới có độ tin cậy cao theo một ngưỡng qui định và được gắn nhãn này vào thư viện mẫu chuẩn để làm cơ sở cho việc đối sánh, nhận dạng tiếp theo
1.2.5 Thuật toán Gentleboost
Thuật toán Gentle AdaBoost (viết tắt là GentleBoost) có nhiều ưu điểm như đơn giản, ổn định và cho kết quả phân loại tốt trong nhiều ứng dụng
Do đó, thuật toán GentleBoost được xem xét trong Luận án này
Tóm tắt Chương 1
Chương này trình bày tổng quan về các vấn đề liên quan đến việc phát hiện ngủ gật; cụ thể: các công trình nghiên cứu về: hành vi ngủ gật, sinh
lý giấc ngủ, các phương pháp phát hiện ngủ gật, các lý thuyết liên quan
về xử lý kỹ thuật số và các bài toán liên quan như: phát hiện khuôn mặt người trong ảnh, phát hiện mắt, nhận dạng trạng thái mắt, phát hiện hành
vi gật lắc; cũng như lý thuyết nhận dạng (gồm có các khái niệm cơ sở
và các bước cơ bản trong việc xây dựng hệ nhận dạng, các tiêu chuẩn và phương pháp học trong nhận dạng) Đây là nền tảng để xây dựng các kỹ thuật như phát hiện trạng thái mắt và ngủ gật ở Chương 2 với ba bài toán, gồm: phát hiện khuôn mặt người trong ảnh; phát hiện mắt người trong ảnh; và nhận dạng trạng thái mắt Hay, Chương 3 trình bày sơ lược về bài toán phát hiện hành vi gật lắc đầu thông qua kỹ thuật xác định hướng mặt người trong ảnh và kỹ thuật phát hiện ngủ gật dựa vào hành vi gật
Trang 9lắc đầu của lái xe
Trang 10CHƯƠNG 2 - KỸ THUẬT PHÁT HIỆN
TRẠNG THÁI MẮT VÀ NGỦ GẬT 2.1 Bài toán phát hiện khuôn mặt người trong ảnh
2.1.1 Tổng quan
Việc phát hiện khuôn mặt người trong ảnh đã được nghiên cứu nhiều và
có nhiều phương pháp khác nhau; chẳng hạn như phương pháp phát hiện
và định vị khuôn mặt từ ảnh có nền phức tạp, hay phương pháp dùng 2 đốm tối và 3 đốm sáng để tả 2 mắt, 2 gò má và mũi, dùng các vạch sọc
để thể hiện đường nét của khuôn mặt, lông mày và đôi môi, hay phương pháp định vị các đặc trưng khuôn mặt và khuôn mặt đối với ảnh đa mức xám Tuy nhiên, do các phương pháp này dùng các phép toán hình thái học như trên nên gặp một số hạn chế nhất định trong việc kết hợp các đặc trưng để định vị khuôn mặt Trong khi đó, phương pháp xác định các đặc trưng cục bộ và bộ khớp đồ thị ngẫu nhiên dùng 5 đặc trưng: 2 mắt, 2 lỗ mũi, đoạn giữa môi và mũi được dùng để thể hiện một khuôn mặt chuẩn
Để xác định một thành phần nằm trong một vùng chứa nó, hiện nay,
kỹ thuật sử dụng đặc trưng Haar trong thuật toán AdaBoost được sử dụng rộng rãi nhất
2.1.2 Đề xuất kỹ thuật phát hiện mặt người
Ý tưởng cơ bản: thực hiện phân lớp nhị phân với mỗi vùng ảnh quan tâm, từ đó kết luận vùng ảnh đó là khuôn mặt hay không
Việc xét duyệt được thực hiện bởi một chuỗi các bộ phân lớp nhị phân và một vùng ảnh được chấp nhận nếu nó được chấp nhận bởi toàn
bộ các bộ phân lớp nhị phân trong chuỗi Các bộ phân lớp nhị phân được xây dựng trên cơ sở sử dụng cây quyết định; trong đó, việc đánh giá tại mỗi nút là một bộ phân lớp nhị phân con Các bộ phân lớp nhị phân con này được xây dựng dưới nhiều dạng khác nhau để có thể lựa chọn những cách thức phân lớp đơn giản và nhanh chóng tại một số cây đầu tiên, giúp nhanh chóng loại những vùng nền, đồng thời thiết kế như vậy sẽ dễ dàng được mở rộng trong việc nghiên cứu thử nghiệm với những cách thức phân lớp khác nhau tại mỗi nút
Việc phát hiện mặt người được tiến hành thông qua hai pha chính
Trang 11Pha thứ nhất là pha học, tức là từ một tập các ảnh khuôn mặt và các ảnh không phải khuôn mặt để tạo ra một bộ dữ liệu học mô hình khuôn mặt mẫu Pha thứ hai là pha phát hiện, việc phát hiện khuôn mặt là việc dò tìm xem một vùng bất kỳ trong ảnh có thỏa mãn các đặc điểm của mô hình đã được xây dựng hay không
a) Xây dựng mô hình nhận dạng khuôn mặt mẫu
Với ý tưởng như vậy, mỗi cây sẽ được xây dựng dựa trên cơ sở tập
dữ liệu huấn luyện có cấu trúc như sau: { (I v w s, ,s s):s=1, 2, ,S}; trong
đó, v s là giá trị nhãn đúng của ảnh I s , và w s là trọng số tương ứng Luận
án này sẽ thực hiện phân lớp nhị phân, tức là gắn nhãn 0 và 1, bằng cách cực tiểu hóa giá trị của hàm mục tiêu:
trong đó: C 0 và C 1 là hai nhóm của tập huấn luyện, tương ứng là kết quả
phân chia của hai giá trị nhị phân 0 và 1; còn các tham số v 0 và v 1 là
trung bình các giá trị nhãn trong C 0 và C 1
Algorithm: Thuật toán học cây
Input: U ={( , ,I v w s s s) :s=1, 2, , }S // bộ dữ liệu huấn luyện
Output: T = {N0, N1 } // cây kết quả được mô tả là tập các nút
Process:
1 T := Ø
2 Idx0 = {0, 1, 2, , S-1} // tập các chỉ số tương ứng với các mẫu trong tập huấn luyện à Sử dụng 1 ngăn xếp để quản lý việc học lần lượt từng nút Mỗi phần tử ngăn xếp là một bộ gồm nút và tập chỉ số các mẫu dùng để học nút đó
3 Stack := Ø // Đưa nút gốc vào ngăn xếp
4 push ( Stack, (N0, Idx0) )
5 while ( Stack ≠ Ø ) // lấy phần tử ở đầu ngăn xếp
6 { N i , Idx i } := pop( Stack ) // Nếu nút đã đạt đủ độ cao, không thực hiện tính
toán chia đôi nữa
12 for all bincls of BCS
13 e := WMSE( bincls, U, Idx i )
14 if (e < minerr )
Trang 1221 push( Stack, (N i*2+1 , Idx i*2+1) )
22 push( Stack, (N i*2+2 , Idx i*2+2) )
24 endwhile
b) Phát hiện khuôn mặt từ ảnh
Ảnh đầu vào được xét duyệt tại mỗi vị trí và kích thước có thể trên
cơ sở một vùng ảnh được chấp nhận nếu nó được chấp nhận bởi toàn bộ các cây trong mô hình đã xây dựng, trong đó việc đánh giá tại mỗi nút
là một bộ phân lớp nhị phân con, với các kỹ thuật lựa chọn cụ thể là phép
so sánh điểm ảnh và đánh giá giá trị trung bình cục bộ
c) Kết quả thử nghiệm
Việc thử nghiệm được tiến hành theo 2 bước: (1) học từ 3.500 ảnh khuôn mặt trong cơ sở dữ liệu khuôn mặt GENKI-SZSL nằm trong bộ MPLab GENKI và 3.019 ảnh thuộc bộ dữ liệu face negative của OpenCV; và (2) chạy thử nghiệm phát hiện
Pha học được tiến hành trên máy tính Core i7 3,6 GHz, RAM 8GB
và mất hơn 4 tiếng để hoàn thành Còn pha thử nghiệm phát hiện được tiến hành với cơ sở dữ liệu khuôn mặt của Markus Weber gồm 450 ảnh khuôn mặt Kết quả, thuật toán phát hiện được 423 ảnh được gán có khuôn mặt người; trong đó có 7 ảnh thực ra không có khuôn mặt người; tức là thuật toán phát hiện đúng 416 ảnh trong 423 ảnh đó Do vậy, khả năng phát hiện của thuật toán này được xác định như sau:
Precision = 416/423 = 0.9834 (hay 98.34%)
Recall = 416/450 = 0.9244 (hay 92.44%)
Như vậy, phương pháp đề xuất cho độ chính xác phát hiện khá tốt;
và có tốc độ xử lý nhanh, đây là cơ sở để có thể phát triển những ứng dụng xử lý khuôn mặt yêu cầu thời gian thực trên dữ liệu video