Hơn một thập kỷ vừa qua, thế giới đã chứng kiến sự xuất hiện của rất nhiềucông trình nghiên cứu về bài toán xác định khuôn mặt người, từ ảnh đen trắng, xámđến ảnh màu, từ ảnh tĩnh đến nh
Trang 1có những bước tiến quan trọng đóng góp một phần không nhỏ cho sự phát triển của
xã hội loài người đặc biệt là lĩnh vực xử lý ảnh
Hơn một thập kỷ vừa qua, thế giới đã chứng kiến sự xuất hiện của rất nhiềucông trình nghiên cứu về bài toán xác định khuôn mặt người, từ ảnh đen trắng, xámđến ảnh màu, từ ảnh tĩnh đến những dữ liệu ảnh thu nhận được từ camera như ngàyhôm nay Các nghiên cứu đi từ bài toán đơn giản, mỗi ảnh chỉ có một khuôn mặtngười nhìn thẳng vào thiết bị thu hình và đầu ở tư thế thẳng đứng trong ảnh đentrắng Cho đến ngày hôm nay bài toán mở rộng cho ảnh màu, có nhiều khuôn mặttrong cùng một ảnh, có nhiều tư thế thay đổi trong ảnh Không những vậy mà còn
mở rộng cả phạm vi từ môi trường xung quanh khá đơn giản (trong phòng thínghiệm) cho đến môi trường xung quanh rất phức tạp (như trong tự nhiên) nhằmđáp ứng nhu cầu thật sự và rất nhiều của con người Sở dĩ bài toán phát hiện mặtngười được quan tâm nghiên cứu như vậy vì nó có rất nhiều ứng dụng đối với thựctiễn cuộc sống
Ở nước ta hiện nay, việc kiểm soát tự động đã có nhiều bước phát triển đáng
kể, việc ứng dụng công nghệ nhận dạng mặt người vào các hệ thống giám sát tựđộng ngày một thiết thực và có khả năng ứng dụng rộng rãi trong nhiều lĩnh vựccủa đời sống kinh tế xã hội Kiểm tra trạng thái người lái xe có ngủ gật, mất tậptrung hay không, và hỗ trợ thông báo khi cần thiết là một vấn đề cấp thiết trong giảiquyết bài toán an toàn giao thông, nhất là trong điều kiện Việt Nam, khi hàng ngày
Trang 2tai nạn giao thông trung bình cướp đi sinh mạng 30 người và làm bị thương hơn 60người khác.
Vì vậy, em đã lựa chọn đề tài “Kiểm tra trạng thái biểu cảm của khuôn mặt người lái xe”, bố cục nội dung của luận văn bao gồm các chương và mục sau: Chương 1: Trình bày tổng quan cơ sở lý thuyết về xử lý ảnh và phát hiện mặtngười trong ảnh
Chương 2: Trình bày một số vấn đề nhằm giải quyết bài toán kiểm tra trạngthái biểu cảm khuôn mặt người
Chương 3: Trình bày các chức năng chính của chương trình thử nghiệmSleep1.0
Phần kết luận: trình bày những nội dung đã làm được, hạn chế và địnhhướng phát triển của đề tài
Tài liệu tham khảo: trình bày những tài liệu tham khảo được sử dụng đểhoàn thành luận văn này
Trang 3MỤC LỤC
PHẦN MỞ ĐẦU 1
MỤC LỤC 3
DANH MỤC CÁC HÌNH 5
CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH PHÁT HIỆN MẶT NGƯỜI TRONG ẢNH 8
1.1 Khái quát về xử lý ảnh 8
1.2 Một số khái niệm cơ bản trong xử lý ảnh 9
1.2.1 Ảnh số 9
1.2.2 Điểm ảnh 9
1.2.3 Mức xám (gray level) 9
1.2.4 Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số 10
1.3 Các vấn đề chung liên quan đến xử lý ảnh số 10
1.3.1 Xử lý ảnh mức thấp 11
1.3.2 Những khó khăn khi xử lý ảnh số 12
1.4 Ứng dụng của hệ thống xử lý ảnh 13
1.5 Quá trình xử lý ảnh số 14
1.6 Các thành phần cơ bản của hệ thống xử lý ảnh 18
1.7 Phát hiện mặt người trong ảnh 21
1.7.1 Khái niệm phát hiện mặt người trong ảnh 21
1.7.2 Một số kỹ thuật xử lý ảnh sử dụng trong phát hiện mặt người trong ảnh 21
CHƯƠNG 2: MỘT SỐ VẤN ĐỀ TRONG GIẢI QUYẾT BÀI TOÁN KIỂM TRA TRẠNG THÁI BIỂU CẢM KHUÔN MẶT 23
2.1 Trạng thái biểu cảm khuôn mặt người 23
2.1.1 Trạng thái, cảm xúc 26
2.1.2 Các trạng thái tâm lý cơ bản 27
2.1.2.1 Trạng thái cân bằng 28
2.1.2.2 Vui vẻ 28
2.1.2.3 Buồn rầu 29
Trang 42.1.2.4 Ngạc nhiên 29
2.1.2.5 Cáu giận 29
2.1.2.6 Phẫn nộ 30
2.1.3 Trạng thái ngủ gật 30
2.2 Phát hiện mặt người trong ảnh 31
2.2.1 Phương pháp phân tích thành phần chính 31
2.2.1.1 Eigenface 36
2.2.1.2 Cách triển khai 37
2.2.2 Phương pháp sử dụng đặc trưng Haar kết hợp Adaboost 40
2.2.2.1 Adaboost 40
2.2.2.2 Đặc trưng Haar 42
2.3 Phát hiện ngủ gật 45
2.3.1 Mắt thời gian thực, Gaze và tư thế khuôn mặt 45
2.3.2 Phát hiện và theo dõi đồng tử 54
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM 65
3.1 Biểu cảm trạng thái ngủ gật của người lái xe 65
3.2 Thay đổi trạng thái của đôi mắt 66
3.3 Giới thiệu chương trình 66
PHẦN KẾT LUẬN 69
TÀI LIỆU THAM KHẢO 71
Trang 5DANH MỤC CÁC HÌNH
Hình 1.1 Mô phỏng quá trình biến đổi hình học 13
Hình 1.2 Các thành phần chính của hệ thống xử lý ảnh 18
Hình 2.1 a) Mô tả dữ liệu đấu vào trên mặt phẳng 2 chiều; b)Mô tả các thành phần chính trên mặt phẳng 33
Hình 2.2 Dữ liệu được khôi phục lại với 1 thành phần chính 36
Hình 2.3 Mô tả hình thức không gian ảnh khuôn mặt trong không gian ảnh 38
Hình 2.4 Vài đặc trưng Haar cơ bản 43
Hình 2.5 Áp dụng đặc trưng Haar vào ảnh 43
Hình 2.6 Vài đặc trưng Haar được xây dựng 43
Hình 2.7 Mô tả về SAT 44
Hình 2.8 Mô tả về RSAT 44
Hình 2.9 Mô tả về RSAT 45
Hình 2.10 Sơ đồ hệ thống giám sát cảnh báo 49
Hình 2.11 Tổng quan về hệ thống giám sát cảnh giác cho tài xế 50
51
Hình 2.12 Nguyên lý về hiệu ứng đồng tử sáng và tối 51
51
Hình 2.13 Hồng ngoại chiếu sáng mắt (a) Hình ảnh đồng tử tối được tạo bởi đèn LEDs hồng ngoại không đặt trên trục quang học camera; (b) hình ảnh đồng tử sáng được tạo bởi đèn LEDs hồng ngoại đặt dọc theo trục quang học camera 51
52
Hình 2.14 Cấu hình nguồn sáng IR 52
53
Hình 2.15 Bức ảnh thực tế về hình dạng hai vòng hồng ngoại chiếu sáng 53
53
Hình 2.16 (a) sáng và (b) hình ảnh đồng tử tối với các tia sáng 53
Trang 6Hình 2.17 Ví dụ thu hình ảnh với mong muốn hiệu ứng đồng tử sáng (a) Không
có kính, (b) có kính; (c) Có kính râm 54
55
Hình 2.18 Thiết kế camera bên trong động cơ 55
56
Hình 2.19 Sơ đồ hệ thống theo dõi và phát hiện đồng tử 56
56
Hình 2.20 Hình nền sự loại bỏ can thiệp chiếu sáng (a) Vùng hình ảnh gồm cả ánh sáng xung quang và ánh sáng hồng ngoại; (b) Vùng ảnh lẻ chỉ gồm ánh sáng bên ngoài; (c) Kết quả hình ảnh từ việc loại trừ (b) và (a) 56
Hình 2.21 Loại bỏ sự can thiệp chiếu sáng qua việc loại trừ hình ảnh 57
Hình 2.22 Hình ảnh đồng tử sáng và tối riêng biệt 58
59
Hình 2.23 Sơ đồ khối của vòng loại trừ hình ảnh 59
60
Hình 2.24 Ánh sáng chói trên khung mắt có độ sáng cân bằng với các đồng tử 60
61
Hình 2.25 Theo dõi và phát hiện đồng tử sử dụng bộ lọc Kalman 61
62
Hình 2.26 Quỹ đạo thực và dự đoán vị trí đồng tử trong 30 khung hình trình tự .62
Hình 2.27 Lọc Kalman theo dõi kết quả với kính 62
Hình 2.28 Ví dụ về theo dõi học trò theo sự can thiệp mạnh mẽ của chiếu sáng bên ngoài 63
Hình 2.29 Định nghĩa về thời gian nhắm mắt và tốc độ mở /nhắm mắt 63
Hình 3.1 Trạng thái khuôn mặt thay đổi a) lúc bình thường, b) khi buồn ngủ 65
Hình 3.2 Sự thay đổi trạng thái của mắt trái 66
Trang 7Hình 3.4 Sự thay đổi góc chụp đôi mắt 66
Hình 3.5 Lấy ảnh từ camera 67
Hình 3.6 Ảnh về trạng thái của mắt trái 67
Hình 3.7 Ảnh về trạng thái của mắt phải 68
Trang 8CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH PHÁT HIỆN MẶT
NGƯỜI TRONG ẢNH 1.1 Khái quát về xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ Nó là một ngànhkhoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nórất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tínhchuyên dụng riêng cho nó
Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục nămnay Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sởkhác Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ bản cho xử
lý tín hiệu chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổiLaplace, các bộ lọc hữu hạn…Thứ hai, các công cụ toán như Đại số tuyến tính,Xác suất, thống kê Một số kiến thức cần thiết như Trí tuệ nhân tạo, Mạng nơ ronnhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: Nâng cao chấtlượng ảnh và phân tích ảnh Ứng dụng đầu tiên được biết đến là nâng cao chấtlượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ những năm 20của thế kỉ XX Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng
và độ phân giải của ảnh Việc nâng cao chất lượng ảnh được phát triển vào khoảngnhững năm 50 của thế kỉ XX Điều này có thể giải thích được, vì sau thế chiến thứhai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi.Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng
và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triểnkhông ngừng Các phương pháp tri thức nhân tạo như mạng nơron nhân tạo, cácthuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụngrộng rãi và thu nhiều kết quả khả quan
Trang 91.2 Một số khái niệm cơ bản trong xử lý ảnh
1.2.1 Ảnh số
Ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ được coi là những thành tố của bức ảnh và thường được biết dưới tên gọi là pixels
-1.2.2 Điểm ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng Để
có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh Trong quá trình
số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trìnhlấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyêntắc bằng mắt thường không phân biệt được 2 điểm kề nhau Trong quá trình nàyngười ta sử dụng khái niệm điểm ảnh được gọi từ picture element Như vậy, mộtảnh là một tập hợp các pixel
Điểm ảnh hay còn gọi là pixel (picture element, pels, image elements) đượcxem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian của đốitượng
Ảnh được xem như là một tập hợp các điểm ảnh Khi được số hoá nó thườngđược biểu diễn là ma trận 2 chiều a[i][j] mà mỗi phần tử có một giá trị nguyên hoặc
là một véc tơ cấu trúc màu
Trang 101.2.4 Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số
Trong các dạng truyền thông cơ bản: lời nói, văn bản, hình ảnh, âm thanh thìhình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất
Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung quanhchúng ta
Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong dự báo thời tiết…
Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận biếtthông qua thị giác
Việc trang bị cho máy tính có khả năng thị giác như con người không phải làviệc dễ dàng Chúng ta đang sống trong một không gian 3D, khi máy tính cố gắngphân tích đối tượng trong không gian 3D thì những bộ cảm biến có sẵn (camera) lạithường cho ảnh 2D Như vậy, việc mất mát thông tin của hình ảnh sẽ xảy ra Vớinhững cảnh động thì sự di chuyển của đối tượng hay sự di chuyển của camera, tất
cả những việc đó làm cho việc mất mát và sai lệch thông tin rất lớn
Ngày nay, cùng với sự phát triển của ngành CNTT, chúng ta mong muốn đưađược những hình ảnh mà con người có thể nhìn thấy được vào máy tính để thựchiện các mục đích khác nhau như: phân tích ảnh, phục hồi ảnh
Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hoá và biểudiễn dưới dạng số gọi là ảnh số Việc xử lý ảnh trên máy tính nhằm mục đích phântích ảnh và phục hồi các thông tin bị sai lệch của ảnh trong quá trình thu nhận.Như vậy, xử lý ảnh số là thực hiện các phép xử lý đối với ảnh số trên máytính Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân bản hiệuquả của thị lực con người, giúp chúng ta nhận biết tốt hơn về thế giới xung quanh
1.3 Các vấn đề chung liên quan đến xử lý ảnh số
Người ta chia xử lý ảnh thành 2 mức: Xử lý ảnh mức thấp và xử lý ảnh mứccao (thị giác máy)
Phương pháp xử lý ảnh mức thấp thường sử dụng rất ít kiến thức (knowledge)
Trang 11Xử lý ảnh mức cao dựa trên kiến thức, mục tiêu và kế hoạch trong việc làmthế nào để hoàn thành những mục tiêu đó Thị giác máy ở mức cao luôn cố gắng
mô phỏng nhận thức của con người và có thể đưa ra những quyết định dựa vàonhững thông tin đã biết về ảnh
Xử lý ảnh mức thấp và thị giác máy ở mức cao khác nhau trong việc sử dụng
dữ liệu ảnh Dữ liệu ảnh mức thấp bao gồm các ảnh gốc được biểu diễn dưới dạng
ma trận ảnh, các phần tử của ma trận biểu diễn giá trị độ sáng của điểm ảnh Trongkhi đó dữ liệu ảnh mức cao khởi đầu từ những ảnh tốt, nhưng chỉ những dữ liệu cóliên quan đến các mục đích ở mức cao mới được đưa ra, việc giảm số lượng dữ liệu
là đáng kể Dữ liệu ở mức cao diễn tả các thông tin về nội dung ảnh
1.3.1 Xử lý ảnh mức thấp
Các kỹ thuật xử lý ảnh mức thấp được thực hiện với việc thao tác trên các ảnh
số Các phương pháp xử lý ảnh mức thấp được đưa ra vào những năm 1970 của thế
kỉ XX Gần đây, các nhà nghiên cứu đang cố gắng tìm ra những giải thuật có hiệuquả hơn và thực hiện các giải thuật đó trên nhiều thiết bị tinh vi mang tính kỹ thuậtcao Ví dụ, các máy tương tự (Parallel machines) đang được sử dụng giúp cho việctính toán một khối lượng phép tính khổng lồ của quá trình hoạt động trên tập hợp
dữ liệu ảnh trở nên dễ dàng hơn
Một vấn đề phức tạp và chưa giải quyết được là thứ tự các bước trong xử lýảnh mức thấp như thế nào để giải quyết công việc được cụ thể và mục tiêu tự độnghoá vấn đề đó vẫn chưa được thực hiện Những năm 1980 của thế kỉ XX, nhiều đề
án tập trung cho vấn đề này sử dụng các hệ thống chuyên gia (expert systems),nhưng các hệ thống chuyên gia vẫn không giải quyết được vấn đề của chính họ Trình tự các bước xử lý như sau đã được công nhận và phổ biến:
1) Thu nhận ảnh: Một ảnh được thu vào bởi một bộ cảm biến (như TVcamera), từ vệ tinh qua các bộ cảm ứng (sensor) hay ảnh, tranh đượcquét trên scanner Ảnh có thể được thu nhận từ nhiều thiết bị và
Trang 12bằng nhiều cách Sau đó ảnh được số hoá để biến đổi tín hiệu tương
tự sang tín hiệu rời rạc (lấy mẫu) và số hoá bằng lượng hoá
2) Quá trình xử lý: Là quá trình xây dựng lại ảnh, phục hồi ảnh, khửnhiễu và tăng cường ảnh
3) Mã hoá và nén ảnh: Là bước quan trọng trong việc truyền ảnh 4) Phân đoạn ảnh: Máy tính cố gắng tách các đối tượng ảnh riêng biệt
ra khỏi ảnh nền
Mô tả và phân loại đối tượng trong một tổng thể ảnh đã được phân đoạn cũngđược hiểu là một phần của quá trình xử lý ảnh mức thấp
1.3.2 Những khó khăn khi xử lý ảnh số
a Sự hiểu biết về hệ thống thị giác của con người còn hạn chế
Chúng ta không có một sự hiểu biết rõ về vấn đề khi con người quan sát, xử lý
và lưu trữ thông tin trực quan như thế nào Chúng ta thậm trí không biết con người
đo chất lượng ảnh trực quan và phân loại ảnh như thế nào Với cùng một bức ảnhthì sự quan sát ở mỗi người là khác nhau
Sự chú ý của bạn đến các vùng hay các đường viền khác nhau cũng có xuhướng làm thay đổi cảm nhận của bạn về bức ảnh
Thậm chí một ảnh được nhìn với một con mắt không thay đổi thì sự cảm nhận
về bức ảnh đó của con người vẫn thay đổi cho dù là rất ít Các nhà nghiên cứu đãlàm ổn định hình ảnh trực tiếp trên võng mạc để loại trừ bất kỳ một hiệu ứng nàoxuất hiện từ sự di chuyển của mắt Và ngay cả trong những điều kiện đó, giác quancủa con người cũng vẫn có thể thay đổi
b Sự diễn tả về bản chất của ảnh không thể hiểu được ngay lập tức
Ảnh tương tự được biểu diễn bằng một hàm 2 biến Sau khi số hoá, ảnhđược biểu diễn dưới dạng ma trận ảnh 2 chiều và được gọi là ảnh số Máy tính
có thể hiểu và xử lý ảnh số nhưng sự biểu diễn đó không thích hợp cho máy móc
có thể hiểu được Những kiến thức về ảnh và những thông tin được rút ra từ ảnh
là cần thiết trong việc cố gắng để hiểu được những mảng số đó
Trang 13Ví dụ:
Đọc và hiển thị ảnh như một hàm 2 chiều (dùng matlab script)
Hiển thị ảnh dưới dạng ma trận ảnh (dùng matlab)
Hiển thị ảnh với các chương trình hiển thị ảnh (AcdSee trên hệ thốngWindows)
Cả hai sự biểu diễn hình ảnh đều chứa những thông tin chính xác như nhau,nhưng khi quan sát hình ảnh dưới 2 dạng biểu diễn đó thì rất khó để có thể tìm ra
sự tương đồng
1.4 Ứng dụng của hệ thống xử lý ảnh
- Văn phòng: hệ thống nhận dạng chữ, nhận dạng tiếng Anh, tiếng Việt nhậndạng được cả chữ, ảnh, bảng
- Nhận dạng chữ OCR (Optical charater Recognition),
- Nhận dạng nhãn OMR (Optical Mark Recognition)
- Nhận dạng tiếng Anh
- Nhận dạng tiếng việt
- Kiểm tra sản phẩm
- So sánh mầu của sản phẩm mẫu với sản phẩm mới
- Kiểm tra độ tròn của chai/lọ
- Nhận dạng công nghiệp, y học, thương mại,
điều tra khoáng sản
- Địa lý: véc tơ hoá bản đồ
- Các phần mềm chuyển đổi ảnh Raster sang
ảnh vector: MapScan của Viện CNTT,
TrixSystem R2V và V2R
Hình 1.1 Mô phỏng quá trình biến đổi hình học
- Hoạt hình: biến đổi hình học, bóp méo hình học
- Quân sự
- Dự báo thời tiết, cháy rừng, lũ lụt, sâu bệnh, khoáng sản
Trang 14- Thiên văn học, vật lý, sinh học.
- An ninh:
- Nhận dạng vân tay, Water Marking
- Nhận dạng khuôn mặt người, nhận dạng tội phạm
- Dấu thông tin trong ảnh
- Chống bạo lực: dùng camera để phát hiện ra sự an toàn ở nơi công cộng,Siêu thị…
- Bar code: nhận dạng mã vạch
- Các robot tự động phục vụ
- Thư viện: Dùng camera để điều khiển robot
Ngoài ra có ứng dụng trong y học làm nổi các ảnh, trong thiên văn học đểkhôi phục lại ảnh do tác động của khí quyển hay nén ảnh trong truyền đi xa hoặclưu trữ
1.5 Quá trình xử lý ảnh số
a Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận quacamera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25dòng), cũng có loại camera đã số hoá (như loại CCD - Change Coupled Device) làloại photodiot tạo cường độ sáng tại mỗi điểm ảnh Camera thường dùng là loạiquét dòng; ảnh tạo ra có dạng hai chiều Chất lượng một ảnh thu nhận được phụthuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)
b Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền
xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng
độ tương phản để làm ảnh rõ hơn, nét hơn
c Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu
Trang 15bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tênngười thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làmmất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào côngđoạn này
Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần đượctách ra trở nên phức tạp, còn ngược lại nếu quá trình phân đoạn được thực hiện quáthô hoặc phân đoạn sai thì kết quả nhận được cuối cùng sẽ không chính xác
d Biểu diễn ảnh (Image Representation)
Biểu diễn ảnh là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh Các vật thểsau khi phân đoạn có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên ranhgiới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó Phương pháp
mô tả thông qua ranh giới vùng thường được sử dụng khi cần tập trung sự chú ývào hình dạng bên ngoài của chi tiết ảnh như độ cong, các góc cạnh v.v Biểu diễnvùng thường được sử dụng khi chúng ta quan tâm tới đặc tính bên trong của vùngảnh như đường vân (texture) hay hình dạng (skeletal)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phânđoạn) cộng với mã liên kết với các vùng lân cận Việc biến đổi các số liệu nàythành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn cáctính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn vớiviệc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở
để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được
Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng củatừng ký tự giúp phân biệt ký tự này với ký tự khác
Trang 16e Nhận dạng và nắn chỉnh bằng nội suy ảnh
Nhận dạng là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả vậtthể đó (ví dụ các phương tiện giao thông có trong ảnh) Nhận dạng ảnh còn là quátrình xác định ảnh, quá trình này thường thu được bằng cách so sánh với mẫuchuẩn đã được học (hoặc lưu) từ trước Nắn chỉnh bằng nội suy là phán đoán theo ýnghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bìthư có thể được nội suy thành mã điện thoại Có nhiều cách phân loại ảnh khácnhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phântheo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số
- Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trongkhoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặtngười…
f Cơ sở tri thức (Knowledge Base)
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sángtối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trongnhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toánhọc đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận
và xử lý ảnh theo cách của con người Trong các bước xử lý đó, nhiều khâu hiệnnay đã xử lý theo các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở trithức được phát huy
Các quá trình xử lý liệt kê ở trên đều được thực hiện dưới sự giám sát và điềukhiển dựa trên cơ sở các kiến thức về lĩnh vực xử lý ảnh Các kiến thức cơ bản cóthể đơn giản như vị trí vùng ảnh nơi có những thông tin cần quan tâm, như vậy cóthể thu nhỏ vùng tìm kiếm
Trang 17Trường hợp phức tạp hơn, cơ sở kiến thức có thể chứa danh sách tất cả những
hư hỏng có thể gặp trong quá trình kiểm soát chất lượng thành phẩm hoặc các ảnh
vệ tinh có độ chi tiết cao trong các hệ thống theo dõi sự thay đổi môi trường trongmột vùng
g Mô tả (biểu diễn ảnh)
Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếptheo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộnhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thôngthường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theocác đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh(Boundary), vùng ảnh (Region) Một số phương pháp biểu diễn thường dùng:
- Biểu diễn bằng mã chạy (Run-Length Code)
- Biểu diễn bằng mã xích (Chaine-Code)
- Biểu diễn bằng mã tứ phân (Quad-Tree Code)
Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhịphân Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
U(m, n) = 1 nếu (m, n) thuộc R
U( m, n) = 0 nếu (m, n) không thuộc R
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n) Với cách biểudiễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1 Giả sửchúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theocác chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể là: (x, y)r; trong
đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên tục theo chiều ngang hoặcdọc
Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh Một đường bất
kỳ được chia thành các đoạn nhỏ Nối các điểm chia, ta có các đoạn thẳng kế tiếp
Trang 18được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn Cáchướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hoá theo số thập phân hoặc
số nhị phân thành mã của hướng
Biểu diễn bằng mã tứ phân
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh Vùng ảnh đầutiên được chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng nhất(chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và không chiatiếp Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên chođến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạothành một cây phân chia các vùng đồng nhất
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh Trong thực tế,các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy theo đặcđiểm ứng dụng Ảnh sau khi được số hóa được nén, lưu lại để truyền cho các hệthống khác sử dụng hoặc để xử lý tiếp theo Mặt khác, ảnh sau khi số hóa có thể bỏqua công đoạn nâng cao chất lượng (khi ảnh đủ chất lượng theo một yêu cầu nàođó) để chuyển tới khâu phân đoạn hoặc bỏ tiếp khâu phân đoạn chuyển trực tiếp tớikhâu trích chọn đặc trưng sau đó thực hiện nâng cao chất lượng ảnh (tăng độ sáng,
độ tương phản, lọc nhiễu) hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhậnđược bị méo) v.v…
1.6 Các thành phần cơ bản của hệ thống xử lý ảnh
Hình 1.2 Các thành phần chính của hệ thống xử lý ảnh
Trang 19- Thiết bị thu nhận hình ảnh: Là thiết bị biến đổi quang-điện, cho phép biếnđổi hình ảnh quang học thành tín hiệu điện dưới dạng analog hay trực tiếpdưới dạng số Có nhiều dạng cảm biến cho phép làm việc với ánh sáng nhìnthấy hoặc hồng ngoại Hai loại thiết bị biến đổi quang - điện chủ yếuthường được sử dụng là đèn ghi hình điện tử và chip CCD (Charge CoupleDevice - linh kiện ghép điện tích)
- Bộ nhớ trong và ngoài: Trong các hệ thống xử lý ảnh số thường có dunglượng rất lớn dùng để lưu trữ ảnh tĩnh và động dưới dạng số Ví dụ, để lưumột ảnh số đen trắng kích thước 1024x1024 điểm, mỗi điểm được mã hóabằng 8 bits cần bộ nhớ ~ 1MB Để lưu một ảnh màu không nén, dunglượng bộ nhớ phải tăng lên gấp 3 Bộ nhớ số trong hệ thống xử lý ảnh cóthể chia làm 3 loại:
1) Bộ nhớ đệm trong máy tính để lưu ảnh trong quá trình xử lý Bộ nhớnày phải có khả năng ghi/đọc rất nhanh (ví dụ: 25 hình/s);
2) Bộ nhớ ngoài có tốc độ truy cập tương đối nhanh, dùng để lưu thôngtin thường dùng Các bộ nhớ ngoài có thể là ổ cứng, thẻ nhớ flashv.v
3) Bộ nhớ dùng để lưu trữ dữ liệu Loại bộ nhớ này thường có dunglượng lớn, tốc độ truy cập không cao Thông dụng nhất là đĩa quangghi 1 lần (ROM) hoặc nhiều lần (ROM) như đĩa DVD có dunglượng 4.7GB (một mặt)
Ngoài ra trong hệ thống xử lý ảnh còn sử dụng các thiết bị cho phép lưu ảnhtrên vật liệu khác như giấy in, giấy in nhiệt, giấy trong, đó có thể là máy in phun, inlaser, in trên giấy ảnh đặc biệt bằng công nghệ nung nóng v.v
- Bộ xử lý ảnh chuyên dụng: Sử dụng chip xử lý ảnh chuyên dụng, có khảnăng thực hiện nhanh các lệnh chuyên dùng trong xử lý ảnh Cho phép thựchiện các quá trình xử lý ảnh như lọc, làm nổi đường bao, nén và giải nénvideo số v.v Trong bộ xử lý ảnh thường tích hợp bộ nhớ đệm có tốc độcao
Trang 20- Màn hình hiển thị: Hệ thống biến đổi điện - quang hay đèn hình (đen trắngcũng như màu) có nhiệm vụ biến đổi tín hiệu điện có chứa thông tin củaảnh (tín hiệu video) thành hình ảnh trên màn hình Có hai dạng displayđược sử dụng rộng rãi là đèn hình CRT (Cathode-Ray Tube) và màn hìnhtinh thể lỏng LCD (Liquid Crystal Display) Đèn hình CRT thường có khảnăng hiển thị màu sắc tốt hơn màn hình LCD nên được dùng phổ biến trongcác hệ thống xử lý ảnh chuyên nghiệp.
- Máy tính: Có thể là máy tính để bàn cũng như siêu máy tính có chức năngđiều khiển tất cả các bộ phận chức năng trong hệ thống xử lý ảnh số
Một hệ thống xử lý ảnh cơ bản có thể gồm: Máy tính cá nhân kèm theo vỉmạch chuyển đổi đồ hoạ VGA hoặc SVGA, đĩa chứa các ảnh dùng để kiểm tra cácthuật toán và một màn hình có hỗ trợ VGA hoặc SVGA Nếu điều kiện cho phép,nên có một hệ thống như Hình 1.2 bao gồm một máy tính PC kèm theo thiết bị xử
lý ảnh Nối với cổng vào của thiết bị thu nhận ảnh là một video camera, và cổng ranối với một màn hình Thực tế, phần lớn các nghiên cứu của chúng ta được đưa ratrên ảnh mức xám (ảnh đen trắng) Bởi vậy, hệ thống sẽ bao gồm một thiết bị xử lýảnh đen trắng và một màn hình đen trắng
Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc trongcông nghiệp Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh mức xám cũng ứngdụng được trên ảnh màu Với lý do đó, hệ thống ban đầu nên chỉ bao gồm các thiết
bị thu nhận và hiển thị ảnh đen trắng Với ảnh màu, nên sử dụng một hệ thống mớitrừ trường hợp bạn cần một camera, TV màu và một màn hình đa tần số (ví dụ như:NEC MultiSync, Sony Multiscan, hoặc Mitsubishi Diamond Scan) để hiển thị ảnhmàu Nếu khả năng hạn chế, có thể dùng PC kèm theo, vỉ mạch VGA và màn hìnhVGA, để dựng ảnh được
Trang 211.7 Phát hiện mặt người trong ảnh
1.7.1 Khái niệm phát hiện mặt người trong ảnh
Phát hiện khuôn mặt người (Face Detection) là một kỹ thuật máy tính để xácđịnh các vị trí và các kích thước của các khuôn mặt người trong các ảnh bất kỳ (ảnh
kỹ thuật số) Kỹ thuật này nhận biết các đặc trưng của khuôn mặt và bỏ qua nhữngthứ khác, như: tòa nhà, cây cối, cơ thể, …
Phát hiện khuôn mặt được coi như một giai đoạn quan trọng trong hệ thốngnhận dạng khuôn mặt Việc xác định chính xác vị trí và kích thước các khuôn mặttrong ảnh là một trong những yếu tố quyết định để giai đoạn kiểm tra xem khuônmặt vừa tìm thấy là ai được chính xác
1.7.2 Một số kỹ thuật xử lý ảnh sử dụng trong phát hiện mặt người trong ảnh
Có nhiều nghiên cứu tìm phương pháp xác định khuôn mặt người, từ ảnh xámđến ngày nay là ảnh màu Trong luận văn này sẽ trình bày một cách tổng quát nhấtnhững hướng giải quyết chính cho bài toán, từ những hướng chính này nhiều tácgiả thay đổi một số ý nhỏ bên trong để có kết quả mới
Dựa vào tính chất của các phương pháp xác định khuôn mặt người trên ảnh.Các phương pháp này được chia làm bốn hướng tiếp cận chính Ngoài bốn hướngnày, nhiều nghiên cứu có khi liên quan đến không những một hướng tiếp cận mà cóliên quan nhiều hơn một hướng chính:
- Hướng tiếp cận dựa trên tri thức: Mã hóa các hiểu biết của con người về
các loại khuôn mặt người thành các luật Thông thường các luật mô tả quan
hệ của các đặc trưng
- Hướng tiếp cận dựa trên đặc trưng không thay đổi: Mục tiêu các thuật
toán đi tìm các đặc trưng mô tả cấu trúc khuôn mặt người mà các đặc trưngnày sẽ không thay đổi khi tư thế khuôn mặt, vị trí đặt thiết bị thu hình hoặcđiều kiện ánh sáng thay đổi
Trang 22- Hướng tiếp cận dựa trên so khớp mẫu: Dùng các mẫu chuẩn của khuôn
mặt người (các mẫu này được chọn lựa và lưu trữ) để mô tả cho khuôn mặtngười hay các đặc trưng khuôn mặt (các mẫu này phải chọn làm sao chotách biệt nhau theo tiêu chuẩn mà các tác giả định ra để so sánh) Các mốitương quan giữa dữ liệu ảnh đưa vào và các mẫu dùng để xác định khuônmặt người
- Hướng tiếp cận dựa trên diện mạo: Trái ngược hẳn với so khớp mẫu, các
mô hình (hay các mẫu) được học từ một tập ảnh huấn luyện trước đó Sau
đó hệ thống (mô hình) sẽ xác định khuôn mặt người Hay một số tác giảcòn gọi hướng tiếp cận này là hướng tiếp cận theo phương pháp học
Trang 23CHƯƠNG 2: MỘT SỐ VẤN ĐỀ TRONG GIẢI QUYẾT BÀI TOÁN
KIỂM TRA TRẠNG THÁI BIỂU CẢM KHUÔN MẶT
2.1 Trạng thái biểu cảm khuôn mặt người
Từ khi loài người sinh ra, trên Trái Đất xuất hiện một hiện tượng hoàn toànmới mẻ - hiện tượng tâm lý người mà nền văn minh cổ đại gọi là linh hồn Khoahọc nghiên cứu hiện tượng này gọi là tâm lý học Từ những tư tưởng đầu tiên sơkhai về hiện tượng tâm lý, tâm lý học đã hình thành, phát triển không ngừng vàngày càng giữ một vị trí quan trọng trong nhóm các khoa học về con người Hiệnnay tâm lý học là ngành khoa học nghiên cứu hành vi, tinh thần và tư tưởng củacon người (cụ thể đó là những cảm xúc, ý chí và hành động) Tâm lý học cũng chútâm đến sự ảnh hưởng của hoạt động thể chất, trạng thái tâm lý và các yếu tố bênngoài lên hành vi và tinh thần của con người Ngành này tập trung vào loài người,tuy một vài khía cạnh của động vật cũng thỉnh thoảng được nghiên cứu Động vật ởđây có thể được nghiên cứu như là những chủ thể độc lập, hoặc một cái nhìn gâytranh cãi hơn được nghiên cứu như một cách tiếp cận đến sự hiểu biết bộ máy tâmthần của con người (qua tâm lý học so sánh) Tâm lý học được định nghĩa một cáchrộng rãi như là "khoa nghiên cứu những hành vi và những tiến trình tâm thần củacon người"
Tâm lý học vừa được nghiên cứu một cách khoa học lẫn phi khoa học Tâm lýhọc chủ đạo ngày nay đa phần đặt nền tảng trên thuyết thực chứng, thông quanhững phân tích định lượng và sử dụng những phương pháp khoa học để thử vàbác bỏ những giả thuyết Tâm lý học có khuynh hướng chiết trung, sử dụng và tiếpthu kiến thức thu thập được từ nhiều ngành khoa học khác để hiểu và lý giải hành
vi của con người
Thuật ngữ Tâm lý học được dùng lần đầu tiên trong "Yucologia hoc est dehominis perfectione, anima, ortu", do nhà triết học kinh điển người Đức RudlofGoeckel (La tinh hóa Rudolph Goclenius (1547-1628)) viết ra, được phát hành tạiMarburg vào năm 1590 Tuy nhiên, thuật ngữ này đã được nhà nhân văn học người
Trang 24Croatia là Marko Marulić (1450-1524) dùng trong thực tế từ sáu thập kỷ trước đótrong tiêu đề của chuyên luận La tinh của ông "Psichiologia de ratione animaehumanae" Mặc dù chính chuyên luận không được bảo tồn, tiêu đề của nó xuất hiệntrong danh sách các công trình của Marulic được người đồng nghiệp trẻ hơn củaông là Franjo Bozicevic-Natalis biên dịch trong "Vita Marci Maruli Spalatensis"của mình (Krstić, 1964) Điều này tất nhiên có thể không phải là việc sử dụng đầutiên, nhưng nó là việc sử dụng được ghi lại trên tài liệu sớm nhất hiện tại biết được.Thuật ngữ đã bắt đầu được dùng rộng rãi kể từ khi nhà triết học duy tâmngười Đức Christian Wolff (1679-1754) dùng nó trong Psychologia empirica andPsychologia rationalis của ông (1732-1734) Sự phân biệt giữa tâm lý học kinhnghiệm (empirical) và lý trí (rational) này được đề cập trong Encyclodedie củaDiderot và được Maine de Biran phổ cập tại Pháp.
Nguồn gốc của từ tâm lý học (psychology) là psyche (tâm lý) rất gần giốngvới "soul" (linh hồn) trong tiếng Hy Lạp, và tâm lý học trước đây đã được coi nhưmột nghiên cứu về linh hồn (với ý nghĩa tôn giáo của thuật ngữ này), trong thời kỳThiên Chúa Giáo Tâm lý học được xem là một ngành y khoa được Thomas Willis nhắc đến khi nói về tâm lý học (trong Doctrine of the Soul) với các thuật ngữ vềchức năng não, một phần của chuyên luận giải phẫu 1862 của ông là "De AnimaBrutorum" ("Hai thuyết trình về Linh hồn của Brutes")
Người sáng lập của ngành tâm lý học là Wilhelm Wundt Vào năm 1879 ôngthiết lập phòng thí nghiệm tâm lý học đầu tiên ở Leipzig, Đức Ông tách Tâm lýhọc ra khỏi các khoa học khác, từ đây tâm lý học trở thành khoa học độc lập Ông
là người theo chủ nghĩa cấu trúc ghestal, quan tâm đến những gì tạo thành ý thức
và mong muốn phân loại não ra thành những mảng nhỏ khác nhau để nghiên cứutừng phần riêng biệt Ông sử dụng phương pháp xem xét nội tâm, yêu cầu mộtngười tự nhìn vào nội tâm và ý thức của bản thân để nghiên cứu Những người theochủ nghĩa cấu trúc cũng tin rằng một người phải được huấn luyện để có thể tự xemxét nội tâm của mình
Trang 25Những người đóng góp cho tâm lý học trong những ngày đầu tiên bao gồmHermann Ebbinghaus (người tiên phong nghiên cứu trí nhớ), Ivan PetrovichPavlov (người Nga đã phát hiện ra quá trình học hỏi thông qua những điều kiệnkinh điển-phản xạ có điều kiện, là khái niệm quan trọng trong nghiên cứu tâm lýcấp cao con người - ("sinh lý thần kinh cấp cao") và Sigmund Freud Freud làngười Áo đã có rất nhiều ảnh hưởng đến môn tâm lý học, mặc dù những ảnh hưởngnày thiên về sinh vật hóa hơn, đóng góp cho ngành khoa học tâm lý Thuyết củaFreud cho rằng cấu trúc hành vi người được thúc đẩy bởi các thành tố cơ bản là ýthức-tiềm thức-vô thức, dựa trên cơ chế "thỏa mãn và dồn nén".
Ngày nay, vị trí tâm lý học có vai trò quyết định đến sức khỏe con người Tổchức Y tế thế giới (WHO) đã định nghĩa sức khỏe là sự tương tác của mối liên hệgiữa Xã hội-Thể chất-Tinh thần con người Năm 1972 Leonchiev đã làm sáng tỏkhái niệm về nghiên cứu tâm lý con người dựa trên hay hướng đến hoạt động cóđối tượng Xây dựng liệu pháp tâm lý trên hoạt động tích cực của cá nhân Yếu tốtiền đề quyết định đến hành vi và năng lực cá nhân đó phương tiện trong cấu trúchoạt động có đối tượng của cá nhân trong môi trường nhất định Tổng hòa các mốiquan hệ xã hội
Tâm lý học là một lĩnh vực nghiên cứu về quy luật chung nhất của sự vậnđộng thế giới đời sống con người dưới sự tác động qua lại tích cực của cá nhân vớithực tại khách quan và những quy luật riêng biệt trong đời sống như : tâm lý họcbất thường, tâm lý học động học, tâm lý học nhận thức, tâm lý học so sánh, tâm lýhọc phát triển, tâm lý học cá nhân, tâm lý học xã hội, tâm lý học nghệ thuật, tâm lýhọc quân sự, tâm lý học tội phạm, tâm lý học sáng tạo, tâm lý học lao động, tâm lýhọc trị liệu, tâm lý học tư vấn, tâm lý học kinh tế, cận tâm lý, và ứng dụng trongthực tiễn đời sống con người Nhiều nghiên cứu tâm lý học được ứng dụng trongcác lĩnh vực khác nhau: quản lý kinh doanh, thiết kế sản phẩm, lao động học, dinhdưỡng, và y học lâm sàng Các chuyên ngành tâm lý học đó gọi là tâm lý học ứngdụng, bao gồm các lĩnh vực: tâm lý học lâm sàng, tâm lý học công nghiệp và tổ
Trang 26chức, các nhân tố con người, tâm lý học pháp lý, tâm lý học sức khỏe, tâm lý họctrường học và các lĩnh vực khác.
Như vậy tâm lý học được chia ra thành rất nhiều các chuyên ngành khác nhau,ứng với các ứng dụng thực tiễn khác nhau, nhưng chúng ta thấy chưa có chuyênngành nào nghiên cứu chuyên sâu về các trạng thái tâm lý của con người, mối liên
hê giữa chúng,… Giả thuyết rằng nếu có một chuyên ngành như vậy thì chúng ta
có thể nghiên cứu được hệ thống các trạng thái tâm lý ở người, những yếu tố ảnhhưởng, sinh ra và quyết định tới các trạng thái tâm lý đó thì chúng ta có thể đưa rađược các ứng dụng để hạn chế những tâm lý có ảnh hưởng không tốt tới sức khoẻ,thể trạng cũng như có ảnh hưởng tốt tới cuộc sống của con người, đưa cuộc sốngcủa con người hướng tới những gì tốt đẹp và hạnh phúc hơn
Song hiện nay chưa có công trình nghiên cứu cụ thể về vấn đề này, có chăngcũng chỉ là những định nghĩa chung chung mang tính chất miêu tả về các trạng tháitâm lý như các cuốn từ điển Đây cũng là điểm khó trong việc hoàn thiện luận văncủa tác giả, từ đó với mong muốn luận văn có thể góp phần tích cực trong vấn đềtìm mối liên hệ giữa các trạng thái tâm lý cơ bản ở con người với nhau, cũng như
sự phối hợp các trạng thái tâm lý cơ bản này để có thể hình thành hay tạo ra cáctrạng thái tâm lý khác, từ đó phân tích và tìm ra cấu trúc của các trạng thái tâm lý ởngười với giả thuyết rằng hệ thống các trạng thái tâm lý ở người được cấu trúc như
hệ thống các màu trong bảng màu RGB, các màu được cấu trúc bằng cách pha trộn
ba màu cơ bản là Red, Green, Blue với các tỷ lệ khác nhau
2.1.1 Trạng thái, cảm xúc
Trạng thái là một thể hiện của một đối tượng trong một thời gian nhất địnhnào đó, người ta dùng khái niệm trạng thái để mô tả những tính chất, những hìnhdáng nhất định ở một thời điểm nhất định, thời gian lưu lại những tính chất và hìnhdáng này có thể ngắn, có thể dài tuỳ theo mức độ ảnh hưởng và làm thay đổi nó củanhững yếu tố tác động Trạng thái tâm lý là những hiện tượng tâm lý diễn ra trong
Trang 27một thời gian tương đối dài, việc mở đầu và kết thúc không rõ ràng như : chú ý,tâm trạng,…
Cảm xúc là những thái độ thể hiện sự dung cảm của con người đối với những
sự vật, hiện tượng có liên quan tới nhu cầu và động cơ của họ Trong sự tác độngqua lại giữa con người và thế giới khách quan, con người không chỉ nhận thức thếgiới mà còn tỏ thái độ của chính mình với nó nữa Đời sống tình cảm của conngười rất phong phú, đa dạng, thể hiện dưới nhiều hình thức khác nhau, ở nhiềumức độ khác nhau, có ảnh hưởng sau sắc tới toàn bộ đời sống tâm lý của conngười Cảm xúc thường thoát khỏi sự kiểm soát của con người, có nghĩa là conngười thường không kiềm chế được nó, ví dụ khi ta phải nhanh chóng quyết địnhmột điều gì và phải làm điều gì ngay lập tức, các phản xạ sẽ quyết định hành độngcủa chúng ta Khi đó chúng ta không có thời gian để suy nghĩ hợp lý và cân nhắcmọi tình huống Trong cơn phẫn nộ hoặc tức giận, ta thường nói ra những lời màsau đó bản thân ta thấy ân hận Hậu quả của những hành động thiếu sự kiểm soát
đó có thể khó mà lường trước được, tình thế hầu như tuột khỏi tay của chủ thể hànhđộng Với lý do đó vai trò của nó trong đời sống tâm lý của con người là rất quantrọng, và cũng do đó có nhiều nghiên cứu về khả năng kiềm chế cảm xúc, điềukhiển và phát hiện cảm xúc, những khía cạnh thế được gọi là : “Trí tuệ cảm xúc”
2.1.2 Các trạng thái tâm lý cơ bản
Tâm trạng hay trạng thái tâm lý là một dạng cảm xúc có cường độ vừa và phảihoặc tương đối yếu, tồn tại trong một khoảng thời gian tương đối lâu dài Trạngthái tâm lý thường bao chùm lên toàn bộ hoạt động của con người, ảnh hưởng rõrệt đến toàn bộ hành vi của con người trong một thời gian khá dài Những trạngthái tâm lý quyết định tính hiệu quả và giá trị của hành vi, hoạt động Sau đây,chúng ta sẽ tìm hiểu một số trạng thái tâm lý thường gặp ở người như : trạng tháicân bằng, vui vẻ, buồn dầu, ngạc nhiên, cáu giận, phẫn nộ,…
Trang 282.1.2.2 Vui vẻ
Vui vẻ là trạng thái tâm lý tích cực, thích thú khi đang gặp việc hợp nguyệnvọng hoặc điều làm mình hài lòng hơn mong đợi, khi ở trạng thái tâm lý vui vẻngười ta thường có những suy nghĩ và tính toán thoáng hơn bình thường, dễ chấpnhận với những yêu cầu hay đề nghị của người khác Ở trạng thái tâm lý vui vẻ cơthể cảm thấy khoẻ mạnh, tinh thần lạc quan, phấn khởi, gần như người ta thoát khỏiđược những ràng buộc về cuộc sống cũng ở trạng thái tâm lý đó, theo các bác sĩchuyên gia, trạng thái vui vẻ có lợi cho việc bài tiết các chất độc trong cơ thể, điều
Trang 29vẻ là trạng thái con người ta luôn muốn hướng tới vì sự thoả mãn, vì tính thoải mái
và có ý nghĩa trên nhiều mặt của đời sống tâm lý, đời sống tình cảm và thể chất củachính họ
2.1.2.3 Buồn rầu
Buồn thường được coi là trạng thái đối lập của trạng thái vui vẻ, đó là trạngthái tiêu cực, không thích thú của những người đang gặp trạng thái đau thươnghoặc đang có điều không được như ý Trong trạng thái buồn, con người ta thường
có cảm giác thờ ơ với sự vật, sự việc và môi trường xung quanh, họ như bị rơi vàomột thế giới riêng, suy nghĩ miên man tới những sự việc gây buồn trong họ Trongtrạng thái tâm lý buồn phiền người ta thường không có nhu cầu đòi hỏi, không cónhu cầu ăn uống, hoặc những nhu cầu khác, họ rơi vào tình trạng xấu hơn mức bìnhthường không muốn làm bất cứ việc gì, không muốn trò chuyện, không muốn điđâu, thường chỉ thích nằm hoặc ngồi một chỗ Trạng thái buồn thường xảy ra khi
có việc đau thương, không như ý với chính bản thân chủ thể hoặc với những ngườithân, những người có tình cảm xấu sắc với chủ thể tâm lý
há miệng, …
2.1.2.5 Cáu giận
Trang 30Cáu giận là tâm trạng tâm lý phấn khích, sẵn sàn có những phản ứng mạnh mẽbằng lời nói hay bằng hành động thiếu suy nghĩ Đó là tâm trạng bột phát khi gặpnhững chuyện, những sự việc diễn ra trái với ý mình, quá đáng với bình thường vàchủ thể là người bất lợi trong những tình huống như vậy Khi gặp những tình huốngkhách quan đem lại những sự bất bình, không đúng, không phù hợp con người sẽthường nổi cáu, họ chuyển từ một tâm trạng đang có sang sự phản ứng mạnh mẽhoặc phát ra bên ngoài hoặc diễn ra trong cơ thể và tâm lý một cách mạnh mẽ, biểuhiện thường là trợn mắt, mặt đỏ ửng, há miệng,… qua những cơn kích động, la hét,phá phách, tấn công người khác, đi với những hiện tượng sinh lý: tim đập nhanh,mặt đỏ lên hay tái mét, tay run; cao độ gọi là cơn khùng Con người trong trạng tháitâm lý cáu giận thường có những hành động hoặc lời nói phản ứng lại một cáchnhanh chóng theo suy nghĩ tức thì nhằm thoả mãn những phấn khích trong lòng,nhằm làm cho rõ những điều không hài lòng theo cách của mình, phản ứng quyếtliệt để lấy thế chủ động và giành phần thắng.
2.1.2.6 Phẫn nộ
Là trạng thái tâm lý quá phấn khích, chủ thể gặp một vấn đề, sự việc bấtthường có hại tới mình nên quá căm phẫn, uất ức tới mức có những hành động hayphản ứng mạnh mẽ với đối phương Trong trạng thái này chủ thể không kiềm chếđược bản thân, phấn khích nên tới cao trào, họ thể hiện bằng những lời hét to,những hành động cụ thể và biểu hiện mạnh mẽ,…
2.1.3 Trạng thái ngủ gật
Trạng thái buồn ngủ khi lái xe là cực kỳ nguy hiểm là đường dẫn xấu tới tất cảmọi người khi tham gia giao thông Vì vậy vấn đề của bài toán kiểm tra và pháthiện trạng thái, dấu hiệu buồn ngủ như suy nghĩ vẩn vơ, quên không chuyển số,không nhìn thấy biển báo giao thông, lái chậm lại không có chủ ý, đạp phanh quátrễ, nháy mắt quá nhiều chảy nước mắt, nhắm mắt lại một lúc, ở trạng thái gà gật.Khi đó thiết bị kiểm tra nhận dạng nhận biết được và cảnh báo cho người lái xedừng lại để nghỉ ngơi để trở về trạng thái tốt nhất tiếp tục điều khiển phương tiện
Trang 312.2 Phát hiện mặt người trong ảnh
Các phương pháp này nhằm trả lời cho câu hỏi “Bức ảnh đầu vào có phải làkhuôn mặt không ?”
Để thực hiện việc phát hiện khuôn mặt, các phương pháp đều dựa trên các đặctrưng đại diện cho khuôn mặt Có thể là các đặc trưng toàn cục như: màu da người,kích thước, và hình dáng để tìm các ứng viên khuôn mặt, rồi sau đó sẽ xác địnhứng viên nào là khuôn mặt thông qua dùng các đặc trưng cục bộ như: mắt, lôngmày, mũi, miệng, và tóc; hoặc nhờ áp dụng các kỹ thuật thống kê và học máy đểtìm ra các đặc tính liên quan của khuôn mặt và không phải của khuôn mặt
Một số phương pháp phát hiện khuôn mặt:
2.2.1 Phương pháp phân tích thành phần chính
Giả sử ta có các quan sát về p biến ngẫu nhiên Chúng ta tìm hiểu, như là cốgắng để đơn giản tình hình, xem lúc nào thì có thể tìm được p biến mới ξ1, ξ2, , ξp
không tương quan với nhau và có thể biểu diễn tuyến tính qua các biến cũ Dĩ nhiên
là chúng ta phải đòi hỏi sự thay đổi biến số này không làm mất thông tin về cácbiến ban đầu Phân tích thành phần chính là một phương pháp nhằm mục đích nhưvậy Nó dụ vào phân tích cấu trúc của ma trận hiệp phương sai ∑của vectơ ngẫunhiên X thông qua việc phân tích các tổ hợp tuyến tính của các thành phần của nó.Mục tiêu cơ bản của phân tích thành phần chính là:
- Rút gọn số liệu
- Biểu diễn và giải thích tập số liệu
Việc phân tích các thành phần chính thường phát hiện ra các mối quan hệ tàng
ẩn trong các thành phần và cho phép ta giải thích các mối quan hệ đó Hơn nữa,việc phân tích các thành phần chính là một giai đoạn trung gian của các nghiên cứukhác, như phân tích hồi quy và phân tích nhân tố thông qua các thành phần chính.Một vấn đề được đặt ra của việc phân tích thành phần chính là số thành phầnchính chủ yếu, hay nói cách khác là cần phải giữ lại bao nhiêu thành phần chínhgiải thích các vấn đề liên quan tới thành phần chính
Trang 32Thông thường các thành phần chính ứng với các giá trị riêng λi rất nhỏ (λi
0
≈ ) không đóng vai trò gì trong phân tích số liệu và ta có thể loại đi Theo ngônngữ về sự khôi phục thông tin về các số liệu ban đầu dựa trên các dự báo tuyến tínhcủa các thành phần X , ,1 X pcủa vector X dựa trên các thông tin về quan sát các
thành phần chính Y , ,1 Y pta chỉ cần giữ lại k thành phần chính nếu
p
k
λ λ
λ
λ + +
+ +
Dựa vào cấu trúc của các thành phần chính ta người ta có thể giải thích vai tròcủa các biến Xi trong các thành phần chính đó và từ đó có một sự lý giải về vai tròcủa các nhân tố trong tự nhiên và xã hội
PCA là một công cụ thống kê đã được xây dựng trong các ứng dụng nhậndạng mặt người và nén ảnh, ngoài ra PCA còn là một công cụ được sử dụng phổbiến trong việc tìm mẫu cho dữ liệu nhiều chiều
Trang 33a) b)
Hình 2.1 a) Mô tả dữ liệu đấu vào trên mặt phẳng 2 chiều; b)Mô tả các thành
phần chính trên mặt phẳng
- Bước 3 : Tính ma trận hiệp phương sai
- Bước 4 : Tính các vector riêng ( eigenvector ) và giá trị riêng (eigenvalue)
- Bước 5 : Chọn thành phần chính
Trang 34o Ta giữ lại k vector riêng với k giá trị k riêng lớn nhất, thể hiện bằng vectorđặc trưng ( feature vector ).
o FeatureVector=( eigenvector1, , eigenvectork )
o Trong ví du
o Nếu chọn cả hai vector riêng thì ta được vector đặc trưng :
o Nếu chỉ chọn vector riêng ứng với giá trị riêng lớn nhất thì ta được vectorđặc trưng :
o Các thành phần chính được xác định bởi :
o Y e T X
i
i = , Trong đó Y i là thành phần chính thứ i, e i là vector riêng thứ i, X
là dữ liệu đã trừ kỳ vọng ban đầu
o Có thể viết lại như sau :
DataAdjust tor
FeatureVec FinalData = T
o Trong ví dụ này: nếu chọn cả hai vector riêng, ta được thành phần chính là :
o Nếu chỉ chọn vector riêng ứng với giá trị riêng lớn nhất, ta được thành phầnchính là:
Trang 35- Bước 6 : Khôi phục dữ liệu ban đầu
Cộng thêm kỳ vọng ta sẽ được dữ liệu ban đầu
o Trong ví dụ với 1 thành phần chính :
o DataAdjust
o Dữ liệu ban đầu :