MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH- Cách th ứ 'n h ất dùng m ột hàm biến đổi thích hợp với mục đích hoặc yêu câu đặt ra để biến đổi giá trị mức xám của điểm ảnh sang một giá
Trang 1Phần 2
NGƯỜI ĐI BỘ TRONG ẢNH
2.1 Tổng q uan về các kỹ thuật tiền xử lý ản h [ 1 ]
2.1.1 Tổng quan vé các kỹ thuật tiền xử lý ảnh vả trích chọn đặc trưng
Đây là giai đoạn quan trọng ảnh hưởng đến kết quả phát hiện và nhận dạng đối tượng, tùy thuộc vào chất lượng ảnh được quét mà ta tiến hành các thủ tục xử lý khác nhau Vì quá trình xử lý sơ bộ có thê làm chậm tôc độ xử lý của hệ thống nên nếu quét ảnh vào là tốt, ta có thể bò qua bước này
Nâng cao chất lượng là bước cần thiết trong xử lý ảnh nhàm hoàn thiện một số đặc tính của ảnh Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục ảnh Tăng cường anh nhầm hoàn thiện các đặc tính của ảnh như:
- Lọc nhiễu, hay làm trơn ảnh
- Tăng độ tương phản, điều chỉnh mức xám cùa ảnh
- Làm nổi biên ảnh
Xử lý ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào eiá trị cua chính nó mà khôns hề dựa vào các điểm ảnh khác Có Iri’ cách tiếp cán với phương pháp này:
Trang 2Phần 2. MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
- Cách th ứ 'n h ất dùng m ột hàm biến đổi thích hợp với mục đích hoặc yêu câu đặt ra để biến đổi giá trị mức xám của điểm ảnh sang một giá trị mức xám khác
- Cách thứ hai là dùng lược đồ mức xám (GrayHistogram )
.1.1.1 C á c kỹ th u ậ t nhị ph ân ảnh
Trong m ột ảnh nhị phân, mồi pixel chi có thể chứa một trong hai giá trị nhị phân 0 hoặc 1 Mồi ảnh nhị phân được lưu trừ như một mảng logic của 0 và 1 Các cách tạo ảnh nhị phàn:
- Tạo một ảnh nhị phân từ một ảnh xám bàng cách trộn, tạo một ánh chỉ số từ một ảnh RGB bàng cách trộn (dither)
- Tạo một ảnh nhị phân từ một ảnh xám, ảnh chỉ số hay ảnh RGB trên
cơ sở của ngưỡng ánh sáng
Ảnh nhị phân: giá trị xám cúa tất cá các điểm ảnh chỉ nhận giá trị 1 hoặc 0, như vậy mỗi điếm ảnh trong ảnh nhị phân dược biểu diễn bơi
1 bit
Trong quá trình thực hiện một sô thao tác, cân đầu vào dưới dạng nhị phân (ví dụ hàm distance tranform - hàm tính dịch chuyển khoảng cách giữa điểm 0 và điểm khác 0 gần nhất), mục 2 1 1.1 giới thiệu các kỳ thuật cơ bản để nhị phân ảnh
Để tạo một ảnh nhị phân từ một ảnh xám, từ một ảnh đánh dấu chỉ số hoặc từ một ảnh RGB dựa trên một ngưỡng mức xám nào đó Đê thực hiện sự chuyển đổi, đầu tiên ta phải chuyển đổi ảnh vào thành định dạng mức xám (nếu không phải là ảnh xám), sau đó lấy ngưỡng để chuyển ảnh xám thành ảnh nhị phân Ảnh thu được sẽ là ảnh nhị phân
có các giá trị 0 (đen) đổi với tất cà các pixel của ảnh vào có mức xám nhỏ hơn ngưỡng và 1 (trắng) cho tất cá các giá trị pixel khác
Vấn dỏ chọn ivuròTiíi 0 như thế nào? Mặc dù không có thuật toán*chọnI1L.UIí! IV Iiũ' Ị' JỊIIILI cho mọi loại anh K.ỹ thuật lây nmrờnu là k\
Trang 3KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỀN
thuật sử dụng m ột tham số 9, gọi là ngưõma độ sane sẽ được chọn dê
áp dụng cho m ột ảnh a[m,n] theo cách sau:
Nếu a[m.n] >= 0 thì a[m,n] = 1; ngược lại a[m.n] = 0
Trong cuốn sách này, nhóm tác giả trình bày một số phưcma pháp sau:
- N gưỡng cổ định:
Phương pháp đầu tiên là chọn một ngưỡng độc lập với dữ liệu ảnh Neu chương trình ứng dụng làm việc với những ảnh có độ tương phản rất cao, trong đó các đối tượng quan tâm rất tối còn nền gần như đồng nhất và rất sáng, thì giá trị ngưỡng không đói 128 trên thanh độ sáng từ 0 đến 255 sẽ là một giá trị chọn tốt
-N g ư ỡ n g dựa trên lược đồ:
Phương pháp thứ hai là chọn ngưỡng dựa trên lược đồ Trone hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng cua vùng hay ảnh cần được phân đoạn Hình 2.1 dưới đây là ví dụ về anh và lược
đồ sáng liên kết với nó
0
' o \°
(u ) Iiu acc to bo ih 'c s ito h k il
H ìn h 2.1 Ví dụ về ảnh và lư ợ c đồ sá n g liên k ế t cùa ả n h [1 ]
Có rất nhiều phương pháp chọn ngưỡng tự động xuất phát tư lược đỏ
• xám {h[a], với a = 0.1 L} Một trong những phưcmc pháp đó la:
(b ) Brightness histoarain o ĩ the imairc
Trang 4Phần 2. MỘT SỐ KỸ THUẬT PHẤT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
phương pháp lọc (Isodata algorithm), phương pháp tam giác (Triangle algorithm), phương pháp đối xứng nền (Background - symmetry algorithm)
Phương p h áp chia đôi (phương pháp lặp -Isoclata algorithm)
Phương pháp này chọn ngưỡng theo kiểu lặp do Ridler và Calvard đưa
ra Các bước của thuật toán như sau:
Quy trình lặp thường bất đầu từ lời giải chấp nhận được
Bước 2: Quy trình dừng khi ngưỡng của hai bước liên tiếp nhau lệch
không đáng kể (sai số e):
while |9k - 9k-1 |>eTính giá trị trung bình nif,k bằng điểm sáng giữa vùng xám cùa vùng đối tượng
Tính giá trị trung bình rrib.k bàng điểm sáng giữa vùng xám của vùng nền
Bước 3: Tính một ngưỡng mới 9k: (bàng cách tính trung bình cộng)
Phương ph áp tam giác (Triangle algorithm)
Phương pháp này do Zack đưa ra và được m inh họa trong hình 2.2 Trong hình này, ta có thể quan sát thấy một đường thẳng đã được xây dựng bàng cách nối từ giá trị lớn nhất của lượng đồ tại độ sánc bmax đên giá trị nhỏ nhất của lược đồ tại độ sáng bmm Với mỗi độ sána b G [ b m a x ,
Trang 5KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
bmin], ta tính khoảng cách d từ giá tri lược đồ tại b là h[b] đẻn đưừng thẳng đã có G iá trị bo ứng với khoảng cách lớn nhất sẽ được chọn làm giá trị ngưỡng 9
Phương ph áp đối x ú n g nền (Background - sym m etry algorithm)
Đường nối đỉnh chia ảnh thành 2 phần diện tích Đối X Ú T12 nhau hoàn toàn là không có, có thể lệch nhau một khoảng là p% Sau nàv luôn coi p% = 5%
Cần xác định đường nối đinh của nền lệch về bên nào Điẻm cao nhát (maxp) bàng cách tìm giá trị lớn nhất trong biểu đồ mức xám
Xác định giá trị (thuộc vùng nền) có thể lấy đối xứng qua đưcmg nói dinh thoả mãn điều kiện p% Giá trị được lẩy đối xứng vừa tim được chính là ngưỡníi
Trang 6Phần 2. MỘT SỐ KỸ THUẬT PHẤT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
1 1
1 1
1 I 0
Ví dụ: Với biểu đồ mức xám trong hình 2.3, maxp = 183, với p% = 5%,
xác định được giá trị mức xám 216 thuộc vùng nền có thể lẩy đối xứng qua đường nối đỉnh được giá trị 150 Vậy giá trị 150 chính là ngưỡng
Tóm lại, ngưỡng được tính theo từng phương pháp là:
+ Phương pháp đối xứng nền với mức 5%: 0 = 150
Kỳ thuật lấy ngưỡng không nhất thiết phải được áp dụng cho toàn bộ ảnh, mà có thể áp dụng cho từng vùng ảnh một Hai tác giả Chow và Kaneko đã phát hiện một số biến thể của kỹ thuật lấy ngưỡng bang cách chia một ảnh có kích thước m X n ra thành nhiều vùng không chồng chéo lên nhau Các giá trị ngưỡng được tính riêng biệt cho từng vùng một và sau đó được kết hợp lại thông qua phép nội suy để hình thành nên một mặt ngưỡng cho toàn bộ ảnh Trong thuật toán mới này, kích thước của các vùng cần được chọn một cách thích hợp sao cho có một lượng đáng kể các điểm ảnh ở trong một vùng nhàro phục vụ cho việc tính lược đồ và xác định ngưỡng tương ứng Tính hữu ích cùa thuật toán này cũng như cua nhiêu thuật toán khác sẽ phụ thuộc vào từng ứng dụng cụ thê
Trang 7KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
2.1.1.2 C á c kỹ th u ậ t lọc nhiễu
Nhiễu là điều không thể tránh khõi trong các hệ thông xử lý tín hiệu Các ảnh số có thể có nhiều loại nhiễu khác nhau Có một sò cách ma nhiễu có thể thâm nhập vào trong ảnh phụ thuộc việc tạo ra anh
Ví dụ:
- Nếu ảnh được quét (scan) từ một ảnh được chụp trên phim, các hạt trên phim là m ột nguồn nhiễu Nhiễu có thể là kết quà của việc phim
bị hư hỏng hoặc do chất lượng của scanner
- Neu ảnh được thu thập trực tiếp từ định dạng số, cơ chê của việc thu thập dữ liệu (chẳng hạn như bộ phát hiện CCD) có thê tạo ra nhiễu
- Sự truyền dữ liệu cũng có thể bị nhiễu tác động
Dù là loại nhiễu nào cũng phải loại bỏ hoặc làm giảm tối đa ảnh hường của nó tùy theo từng loại nhiễu mà áp dụng các kỹ thuật lọc Trên thực
tế có thể sử dụng một sổ cách để loại bỏ hoặc giảm nhiễu trong một ảnh Các cách khác nhau được sừ dụng cho các loại nhiễu khác nhau Một trong số đó là:
- Sử dụng bộ lọc tuyến tính (Linear Filter)
- Sử dụng các bộ median (Median Filter)
S ử d ụ n g các bộ lọc tuyến tính (Linear Filter)
Ta có thê sử dụng các bộ lọc tuyến tính để loại bỏ nhiễu trorm anh Các
bộ lọc này chăng hạn như bộ lọc trung bình hoặc bộ lọc Gauss là thích hợp Ví dụ một bộ lọc trung bình được sừ dụng để loại bo các hạt nhiễu
từ một ảnh chụp trên phim Do mồi pixel được thiết lập tới giá trị trung bình của các pixel xung quanh nó, do vậy sự biến động địa phương gáy
ra bời các hạt nhiễu bị giảm bớt
Phép lọc tru n g bình
Với lọc trung bình, mồi điêm ảnh được thay thế bàng trunu b:nh cua các trọng số điêm ánh lân cận Được định nghĩa:
Trang 8Phẩn 2. MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI Bộ TRONG ẢNH
v{m,ri) = Y JY j{kj )eiVa ( k , l ) y ( m - k , n - l ) (2 1 )Nếu trong kỹ thuật lọc trên, ta chọn các trọng số bàng nhau, phương trình trên có dạng:
v ( m, n ) = - ^ Y JY j{kJ)eWa ( k , l ) y ( m - k , n - l ) (2 2 )Với: y (m , n)\ ảnh đầu vào
a(k, ỉ): là cửa sổ lọc.
Với ũk.i = Ỉ/N và N w là số điểm ảnh trong cửa sổ lọc w.
Lọc trung bình có trọng số chính là thực hiện chập ảnh vào với nhân chập H Nhân chập H trong trường hợp này có dạng:
'1 1 r
H = —
9 1 1 1
1 1 1Trong lọc trung bình, thường ưu tiên cho các hướng để bảo vệ biên của ảnh khỏi bị m ờ khi làm trơn ảnh Các kiểu mặt nạ được sử dụng tùy theo các trường hợp khác nhau Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa là điểm ảnh ở tâm cửa sổ sẽ được thay bởi tổ hợp các điểm lân cận chập với mặt nạ
Giả sử ảnh đầu vào biểu diễn bởi ma trận:
115
6
Ảnh sổ thu được bời lọc trung bình Y = H <8> I có dạng:
Trang 9KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIẾN
Làm trơn nhiễu bàng lọc phi tuyến
Các bộ lọc phi tuyến hay được dùng trong kv thuật tãnc cườrm ảnh Trong kỹ thuật này dùng bộ lọc trung vị, giả trung vị lọc neoài Với lọc trung vị, điểm ảnh đầu vào được thay thế bởi trung vị các điêm ãnh còn lọc giả trung vị dùng trung bình cộng của 2 giá trị "trung vị" (trung bình cộng của max và min)
S ử d ụ n g các bộ lọc tru n g vị (bộ lọc m edian)
Trung vị được viết với công thức:
Kỹ thuật này đòi hỏi giá trị các điểm ánh trong cửa sổ phai xếp theo thứ
tự tăng hay giảm dần so với giá trị trung vị Kích thước cưa sô thường được chọn sao cho số điểm ảnh trong cứa sổ là lẻ Các cưa sỏ hay dùng
là cửa sổ có kích thước 3 X 3 5 X 5 hoặc 7 x 7
Tính chất cùa lọc trung vị:
+ Lọc trung vị là loại lọc phi tuyến Điều này dễ nhận thấy từ:
Trungvi(.v(/;?) + y{m)) * Trungvi(x(w)) + Trungvi(y(m))
+ Có lợi cho việc loại bo các điểm ảnh hay các hàm mà vẫn đam bào độ phân giải
+ Hiệu quả uiàm khi số điểm cừa sổ lớn hay barm một nưa số diém trong cửa sô Điều này dễ giải thích vì trung vị là (A'„ - 1 )2 giá trị lớn nhát nêu Y„ lê Lọc trunu vị cho trườnu hợp 2 chiêu coi nhưng lọc trung vị tách dược theo tinm chiêu
Trang 10Phần2. MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
Sử dụng các bộ lọc trung vị tương tự như việc sử dụng các bộ lọc trung bình (averaging filters), mỗi pixel ra được thiết lập giá trị trung bình của các giá trị pixel lân cận của pixel vào tương ứng Tuy nhiên, với bộ lọc này, giá trị của một pixel ra được quyết định bởi median của các pixel lân cận hơn là giá trị trung bình Median thường nhỏ hơn nhiều so với trung bình các giá trị xa nhất (được gọi là outliers) (Trong Matlab hàm m edfilt2 sử dụng phép lọc median)
Ví dụ sau đây so sánh việc sử dụng một bộ lọc trung vị và một bộ lọc trung bình để loại bỏ nhiễu là “bụi lấm tấm muối tiêu” Loại nhiễu này bao gồm một tập các pixel ngẫu nhiên được thiết lập thành màu đen hoặc trăng Trong cả hai trường hợp, kích cỡ của vùng xung quanh được sử dụng để lọc là 3 X 3
H ìn h 2.4 So sánh bộ lọc trung vị và bộ lọ c tru n g bình
Trang 11KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
2.1.1.3 M ộ t số đ ặ c tr ư n g dự a trên phân bố m ứ c xám
Mức xám là kết quả của sự biến đổi tưomg ứng 1 giá trị độ sáng cùa 1 điểm ảnh với 1 giá trị nguyên dương Thông thườne nó xác định trong [0,255] tùy thuộc vào giá trị mà mỗi điêm ảnh được biêu diễn Cac thang giá trị mức xám thông thường: 16, 32, 64, 128 256 (mức 256 lỉ mức phổ dụng Lý do: từ kỳ thuật máy tính dùng 1 bvte (8 bit) để biếu diễn mức xám Mức xám dùng 1 byte biểu diễn: 28 = 256 mức tức là từ
0 đến 255)
Histogram là đồ thị mô tả mối quan hệ giữa mức xám và số điểm ành co chung mức xám
Lược đồ xám là lược đồ biểu diễn số lượng điểm ánh thuộc một mức
xám trong ảnh Hàm biểu diễn lược đồ xám tại mức xám k:
h(k)= nk
Trong đó:
k - mức xám thứ&, k e[0 , L -1 ];
Hk - số lượng điểm ảnh có mức xám bằng k.
Lược đồ xám biểu diễn bởi:
- Trục hoành biểu diễn mức xám;
- Trục tung biểu diễn số lượng điểm ảnh hoặc tần suất xuất hiện
Trong thực tế, lược đồ xám được biểu diễn thông qua tần suất xuất hiện của mức xám k Tần suất xuất hiện được tính theo công thức:
p(k) = nỵjn với k = 0,1, 2, , L - \.
Trong đó: n là tổng sổ điêm ảnh.
Tổng của tất cả các thành phần của lược đô xám được chuản hóa băng 1 :
Trang 12Phẩn2. MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
/ , - Ị
t p‘-x
k=0Lược đồ xám là một trong những yếu tố cơ bản trong kỹ thuật xử lý ảnh trong miền không gian Ta có thể nâng cao chất lượng ảnh thông qua việc xử lý lược đồ xám Lược đồ xám cũng là một công cụ rất hữu ích trong các ứng dụng khác của xử lý ảnh, ví dụ như nén ảnh và phân đoạn ảnh Việc tính toán trên lược đồ xám đơn giản, nên việc thiết kế phần cứng để thực hiện các công việc tính toán này rất “kinh tế” Đây chính
là nguyên nhân rất thích hợp trong các thao tác xử lý ảnh thời gian thực.Lược đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh Tính động của ảnh cho phép phân tích trong khoảng nào đó phân bố phần lớn của các mức xám của ảnh: ảnh rất sáng hay ảnh rất đậm
Đặc điểm lược đồ xám của ảnh:
- Ảnh tối:
60 00
H ìn h 2.5 Ảnh tối và lược đồ xám tương ứng
Lược đồ xám của ảnh tối phân bố chủ yếu về phía mức xám thấp
Trang 13KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
H ìn h 2.7 Ả n h tư ơ n g p h ả n thấp và lư ọ c đồ xá m tư ơ n g ứ ng
Lược đồ xám của ảnh tương phản thấp phân bô chù yếu ơ mức xám trung bình
Trang 14Phấn2. MỘT Số KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
- Anh tương phản cao:
H ìn h 2.8 Ảnh tương phản cao và lược đồ xâ m tương ứng
Lược đồ xám của ảnh tương phản cao phân bố trên toàn lược đồ
Theo định nghĩa của lược đồ xám, việc xây dựng đơn giản Thuật toán xây dựng lược đồ xám được mô tả như sau:
c Tinh giá trị Max của bảng H
Sau đò hiện bảng trong khoảng từ 0 đến Max
Kết thúc
Thu nhận ảnh không phải lúc nào cũng cho những ảnh với chất lượng tốt Tăng cường ành sẽ giúp cải thiện chất lượng ảnh trước khi thực hiện các thuật toán xử lý ành tiếp theo nhàm gia tăng hiệu quà xử lý Một
Trang 15KỸ THUẬT XỪLÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
trong các thuật toán được sử dụng để tăng cường chất lượnc ảnh là: giãn lược đồ xám, cân bằng lược đồ xám
Đe tăng cường độ tương phản của một số ành phải thav đôi lược đồ mức xám của ảnh đó Một ảnh có độ tương phản kém thi lược đô mức xám của nó phân bố trong một vùng hẹp, ảnh có chất lượne tốt thì lược
đồ mức xám được m ở rộng và phân bố bàng phang
Các phư ơng pit áp biến đồi lược đò xám
• Giãn lược đồ xám
Thường trong một số ảnh, các giá trị mức xám không phù khắp trên toàn lược đồ mà chỉ tập trung ở một số mức xám nhất định Điều này làm cho ảnh quá tối, quá sáng hoặc tương phản thấp Đê táng chất lượng ảnh, ta thực hiện thao tác phân bố lại lược đồ xám trên toàn mức xám của ảnh Trên lược đồ xám, ta có thể xác định được eiá trị mức xám lớn nhất ữ m a x và giá trị mức xám nhỏ nhất amin như hình 2.9:
Trang 16Phẩn2. MỘT Số KỸ THUẬT PHẤT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
Gọi I là ảnh ban đầu, J là ảnh kết quả sau khi giãn lược đồ xám
Giả sử mức xám của ảnh I là k có giá trị từ 0 đến L -1 với L = 2B, với điều kiện 0 < a mjn < amax < L - l , thao tác giãn độ tương phản chính là một ánh xạ sao cho:
Giá trị mức xám nhỏ nhất amin của ảnh —» giá trị 0
Giá trị mức xám lớn nhất amax của ảnh -> giá trị L -1
Gọi Sk là mức xám của ảnh J tương ứng với mức xám k của ảnh I Phép ánh xạ được biểu diễn theo công thức:
st = - a ~ y ♦ ( * - « , „ ) (2.4 )
C ỉ- — ữ -max min
Ví dụ 1: Chương trình minh họa đọc 1 ảnh xám tên hatdo.bmp, hiển thị
ảnh và hrợc đồ xám tương ứng sau khi cân bằng:
Chương trình m inh họa viết bàng Matlab:
1= imread(1hatdo.b m p ');J=I;
amax= m a x ( m a x (J ) );amin=min(min(J ) );L=256;
J = (L-l)/ (amax-amin)*(J-amin);
subplot(2,2,1);imshow(I );title(1 anh ban d au');
subplot(2,2,2);i m h i s t (I );t i t l e ('Luoc do xam anh v a o '); subplot(2,2,3);i m s h o w (J ) ;t i t l e (1anh sau can bang');
subplot(2,2,4);imhist(J);title('Luoc do xam anh can bang'); Kết quả chương trinh:
Trang 17KỸ THUẬT Xử LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
H ình 2.10 Ảnh và lược đồ xám cùa ảnh trước (a) và ảnh sau khi cân bằng (b)
sử dụng phương pháp giãn độ tương phản
Hình 2.11 minh họa sử dụng phương pháp giãn lược đổ xám với ảnh đầu vào tối, sáng, độ tương phản thấp
Cân bằng lược đồ x á m
Cân bằng lược đồ mức xám được thực hiện theo các bước sau:
Bước 1: Tính rik sổ điểm ảnh có mức xám bàng k.
Bước 2: Tính tần suất xuất hiện mức xám k theo công thức:
p {k) = — , với k = 0, 1 , 2 , L - 1
n Bước 3: Tính xác suất xảy ra mức xám nhỏ hơn bàng k theo cỏníỉ thức:
T (k ) = L > ) = - X j = o n j ’ với * = 0» 1 2 L - 1 (2.5)
Bước 4: Tính mức xám Sk cùa ảnh đầu theo công thức:
Trang 18Phẩn 2. MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
Với Sk e [0 , L -1 ], vì Sk là số điểm ảnh có mức xám bàng k của ảnh đâu
ra, nên Sklà một số nguyên
Bước 5: Ánh xạ tương ứng từ mức xám k cùa ảnh đầu vào thành mức
xám Skcùa ảnh đầu ra
* H k I' S É ỉ
c) C ác lư ợ c đồ xá m tư ơ ng ứng: lư ợ c đồ trên tư ơ n g ứ n g v ớ i ảnh ba n đầu
lư ợ c đồ d ư ớ i tư ơng ứng với ảnh sa u k h i cân bằng.
Trang 19KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
Ví dụ 2: Cho ảnh I có 10 mức xám Cân bàng lược đồ xám anh I?
Cân bàng lược đồ xám theo bảng sau:
B ả n g 2.1 Cân b ằ n g lư ợ c đồ x á m cho ảnh I
Ví dụ 3: Chương trình minh họa đọc l ảnh xám tên Hatdo.bmp hién thị
ảnh và lược đồ xám tương ứng sau khi cân băng:
Chương trình minh họa viết bàng Matlab:
Trang 20Phần 2. MỘT Số KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI Bộ TRONG ẢNH
Trang 21KỸ THUẬT XỬ LỸ ẢNH, ỨNG DỤNG TRONG THỰC TIẾN
if (I(i,j)==t)
J ( i , j ) = s ( t + 1 ) ; end;
end;
end;
end;
s ubplot(2,2,1);i m s h o w (I );t i t l e (1 Anh ban d a u ’ ;
s ubplot(2,2,2);irrthist(I );t i t l e ('Luocdo xam ar.r dau'); subplot(2,2,3);i mshow(J ) ; title('Anh sau can bang');
subplot(2,2,4);i mhist(J ) ;t i t l e ('Luoc do xar anh can bang 1 ) ;
Ket quả thực hiện:
Trang 22Phẩn 2. MỘT Số KỸ THUẬT PHẤT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
i
H ìn h 2.13 Ví dụ về cân b ằng lư ợ c đồ xám a) Ả n h ban đ ầ u ; b) Ả n h k ế t quả sau k h i cân b ằng lư ợ c đồ xám ;
c) Các lư ợ c đồ x á m tư ơ n g ứng: lư ợ c đồ trên tư ơ n g ứng với ảnh ban đầu,
lư ợ c đồ d ư ớ i tư ơ n g ứng với ảnh sa u k h i cán b ằng
2.1.1.4 M ột số đ ặc trư n g dựa trên biên ảnh
Các đặc trưng của ảnh thường gồm: mật độ xám, phân bố xác suất, phân
bố không gian, biên ảnh Vì biên ảnh có tầm quan trọng đặc biệt trong phân tích ánh nên phần này được dành riêng để mô tả và các phương pháp dò biên
Biên là một vân đè chù yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ánh chủ yêu dựa vào biên
Trang 23KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
Điểm biên: M ột điểm ảnh được gọi là điểm biên nêu có sự thay dòi
nhanh hoặc đột ngột về mức xám (hoặc màu)
Đ ường biên (đường bao — boundary): tập hợp các điẽm biên liên tiêp
tạo thành m ột đường biên hay đường bao
Ỷ nghĩa cùa đường biên trong x ử lý: đường biên là một loại đặc trưng
cục bộ tiêu biểu trong phân tích, nhận dạng ảnh; ngoài ra biên được sư dụng làm phân cách các vùng xám (màu) cách biệt; ncược lại các vùngảnh cũng được sử dụng để tìm đường phân cách
Tầm quan trọng của biên: chỉ cần đường biên, người ta có thê nhận biết
được đối tượng
Mô hình biểu diễn đường biên: theo toán học: điêm ánh có sự biên đôi
mức xám u(x) một cách đột ngột theo hình 2.14 sau:
Một trong những phương pháp phát hiện biên nhàm làm nồi biên dựa vào sự biến thiên về giá trị độ sáng cùa điềm ành là các kỳ thuật Gradient, kỹ thuật Laplace Cách tiếp cận theo đạo hàm bậc nhất cùa ảnh dựa trên kỳ thuật Gradient, nếu lấy đạo hàm bậc hai cua anh ta có
kỳ thuật Laplace Các phương pháp này tò ra khá hiệu qua vi ít anh hưởng của nhiễu, dễ cài đặt
Trang 24Phấn2. MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
a) K ỹ thuật p h á t hiện biên Gradient
Phương pháp gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm Theo định nghĩa, gradient là một vectơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo 2 hướng X và y Các thành phần của gradient được tính bởi:
Trong đó, dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng X, y
tương ứng (khoảng cách tính bàng số điểm, thực tế chọn d x - d y - 1 )
Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng X, y.
Tuy ta nói là lấy đạo hàm nhưng thực chất chi là mô phỏng và xấp xi đạo hàm bằng kỳ thuật nhân chập do ảnh số là tín hiệu rời rạc, do vậy đạo hàm không tồn tại
Với một ảnh liên tụcyỊx,^), các đạo hàm riêng của nó cho phép xác định
vị trí cực đại cục bộ theo hướng của biên Thực vậy, gradient cùa một ảnh liên tục, biểu diễn bởi một hàmy(x,y), dọc theo r với góc 9, được định nghĩa bởi:
d f = õ f dx õ f d y + = r os0 + f sin 0
df/dx đối với 9 đạt cực đại khi (dfJdQ)(dfỉdr) = 0 hay - /is in 9 + / VCOS0 = 0
Do vậy, ta có thể xác định hướng cực đại của nó:
Trang 25KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIẾN
Hình 2.15 biêu diễn Gradient của ánh theo hướng 0:
H ìn h 2.15 G ra d ie n t cùa ảnh theo h ư ớ n g 9
Theo định nghĩa về gradient, nếu áp dụng nó vào xừ lý anh việc tính toán sẽ rất phức tạp Để đơn giản mà không mất tính chât cua phương pháp gradient, người ta sử dụng kỳ thuật gradient sử dụrm một cặp mặt
nạ Hi và H2 trực giao (theo 2 hướng vuông góc) Neu định nghĩa gi và
ký hiệu là g tại điểm (m, n) được tính theo công thức:
Qr ( m , n ) = t a n '1 g 2( m, ri ) I g ị { m , r i ) (2.10)
Đe giảm tính toán, công thức trên được tính gần đúng bơi:
Các toán tử đạo hàm được áp dụng là khá nhiều, phạm vi cuốn sách chi
đề cập đến một số toán từ tiêu biểu: toán từ Robert, Prewitt Sobel
• Toán tứ Robert
Toán tử Robert được Robert đề xuất vào năm 1965 Nó là áp dụng trực
tiếp của công thức đạo hàm tại điểm (x.y) Với mỗi điểm ảnh Ux, y ) cùa
I, đạo hàm theo X , theo>’ được ký hiệu tương ứng bời gx, gy được tính:
ị g t = I ( x + 1 V) - I ( x y )
Trang 26Phấn 2. MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
Điều này tương đương với việc chập ảnh với 2 mặt nạ H\ và / /2:
Ta gọi //], //2 là mặt nạ Robert
Trong trường hợp tổng quát, giá trị gradient biên độ g và gradient
hướng 0r được tính bởi công thức 2.10 Thường để giảm thời gian tính toán, người ta còn tính gradient theo các chuẩn sau:
H ư ớ ng ngang (x) H ướ ng d ọ c (y)
Gradient được xấp xỉ bởi công thức:
G.v = Hx ® / và Gy = H y® I
Thực tế cho thấy toán tử Sobel, Prewitt tốt hơn so với toán tử Robertbởi chúng ít nhạy cảm với nhiễu Việc lấy đạo hàm một tín hiệu có xu
Trang 27KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIẾN
hướng làm tăng nhiễu trong tín hiệu đó Độ nhạy cám này có thẻ làm giảm xuống nhờ thao tác lấy trung bình cục bộ trong miên phú bơi mặt nạ
Tóm lại: Các kỹ thuật sử dụng phương pháp G radient khá tôt khi độ
sáng có tốc độ thay đổi nhanh, khá đơn giản trên cơ sở các mặt nạ theo các hướng N hược điểm cùa các kỹ thuật Gradient là nhạy căm với nhiễu và tạo các biên kép làm chất lượng thu được không cao
a) K ỹ th u ậ t Laplace
Để khắc phục hạn chế và nhược điểm của phương pháp Gradient, trong
đó sử dụng đạo hàm riêng bậc nhất người ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai hay toán tử Laplace Phương pháp dò biên theo toán
từ Laplace hiệu quả hơn phương pháp toán tử Gradient trong trường hợp mức xám biến đổi chậm, miền chuyển đổi mức xám có độ trải rộng.Toán tử Laplace được định nghĩa như sau:
Toán tử Laplace dùng một số kiểu mặt nạ khác nhau nhàm tính gần đúng đạo hàm riêng bậc hai Các dạng mặt nạ theo toán từ Laplace thường dùng:
kỳ thuật này rất nhạy với nhiễu, do vậy đường biên thu được thướng kém ổn định
Trang 28Phẩn 2. MỘT SỐ KỸ THUẬT PHẤT HIỆN NGƯỜI ĐI Bộ TRONG ẢNH
b) K ỹ th u ậ t đạo h à m tính chộp - P h ư ơ n g phá p C anny
Phương pháp này do John Canny ở phòng thí nghiệm MIT khởi xướng vào năm 1986 Canny đã đưa một tập hợp các ràng buộc mà một phương pháp phát hiện biên cần phải đạt được Ông đã trình bày một phương pháp tối ưu nhất để thực hiện được các ràng buộc đó Phương pháp này được gọi là phương pháp Canny
Phương pháp này dựa trên cặp đạo hàm riêng bậc nhất với việc làm sạch nhiễu Đây là phương pháp tách đường biên khá phổ biến được dùng theo toán tử đạo hàm Như đã nói, phương pháp đạo hàm chịu ành hưởng lớn của nhiễu Phương pháp đạt hiệu quả cao khi xấp xỉ đạo hàm bậc nhất của Gauss:
Thuật toán được tiến hành qua bốn bước cơ bản sau:
Bưó'c 1: Đọc ảnh I cần x ử lý: tiến hành làm trơn ảnh bang cách nhân
xoắn ảnh với bộ lọc Gauss Cách thức tiến hành giống như tiến hành ờ
Laplace o f Gauss
hướng (x và y) với một bộ lọc dựa trên đạo hàm bậc nhất (các bộ lọc của kỹ thuật Gradient)
Từ đó đưa ra kết quả đạo hàm ảnh sau khi tiến hành nhân chập với Gauss
Sau khi làm trơn ảnh ở bước 1 (nhân ảnh với bộ lọc Gauss) ta tiến hành đạo hàm bậc nhất kết quả đó Ket quả đạo hàm s là đạo hàm cùa tích ảnh I và hàm Gauss (x,y) Điều này tương ứng với đạo hàm của hàm Gauss sau đó nhân với ảnh I
p y .
g x gy
Trang 29KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỂN
N hư vậy, kết quả ảnh bước hai chính là sự tổng hợp đạo hàm cua Gauss theo hướng X nhân với ảnh / và đạo hàm cùa Gauss theo hướng ) nhân với ảnh I.
Nghĩa là ta có thể đạo hàm hàm Gauss theo hai hướng rồi mới tiến hành nhân chập với ảnh thay vì nhân chập ảnh với hàm Gauss rôi mới đạo hàm (Hình 2.16)
H ìn h 2.16 Đ ạo hàm hàm G auss theo hai h ư ớ n g X và ỵ
N hư vậy cách thực hiện bước 2 như sau:
Sau khi tiến hành nhân xoắn ảnh / với bộ lọc Gauss ờ bước l ta có một ảnh mới s được làm trơn Tiến hành thực hiện bước 2 bàna cách lấy đạo
Như đã biết, phương pháp Gradient là phương pháp dò biên cục bộ dựa
vào cực đại cùa đạo hàm đó chính là phương pháp đạo ham bậc nhất
Chính vì vậy, ta có thể thực hiện việc đạo hàm ờ bước 2 b ần2 cách nhân ảnh kêt quả s ờ bước l với các mặt nạ trong phương pháp Gradient dựa theo các toán từ như Sobel:
Trang 30Phẩn 2. MỔT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
1 0 -1 -1 - 2 -1
Sau khi tiến hành nhân chập ảnh theo hai hướng X và y ta được hai ảnh
theo hai hướng là sx và Sy, ta tiến hành tổng hợp 2 kết quả đó được kết quả cuối cùng s :
Ảnh S’ tìm được là kết quả của bước 2
Bưóc 3: Cho ảnh kết quả ở bước trên tiến hành “Non - maximum Suppression” nghĩa là loại bỏ bớt các điểm cạnh (loại bỏ bớt nhiễu), chỉ giữ lại điểm có mức xám cao
Đối với mỗi điểm ảnh trên ảnh S’ ta tiến hành so sánh giá trị của điểm
đó với giá trị của hai điểm lân cận điểm đó Hai điểm lân cận này là hai điểm nằm trên đường thẳng chứa hướng của đường biên 9
Giả sử ta có điểm biên đang xét tại vị trí (x ,y), ta có 8 điểm biên lân cận điểm biên này như hình 2.17
Tại điểm biên đó, ta tiến hành tính giá trị góc của hướng đường biên 9 Neu hướng của đường biên 0 <= 22.5° hoặc 0 > 157.5° thì đặt giá trị của 0 = 0° và khi đó hai điểm biên lân cận điểm biên này tại vị trí(A - 1 ,>’) v à (x + l,j)
Trang 31KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
H ìn h 2.17 H ình m ô tả các điểm biên lân cận
Tương tự ta có kết quả hai điểm biên lân cận theo các hướní: biên khác
nhau như bảng 2.2 dưới đây:
B ả n g 2.2 Đ iể m biên lân cận theo c á c h ư ớ n g b iê n k h á c n h a u
Trang 32Phẩn 2. MỘT Số KỸ THUẬT PHẤT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
+ Nếu điểm ảnh là lớn nhất thì giữ lại điểm biên này (đánh dấu điểm biên), ngược lại nếu nó nhỏ hơn một trong hai đicm hiên lân cận thì điểm biên này bị loại đi (cho giá trị điểm biên này bàng 0);+ Ta được kết quả ảnh sau khi đã loại đi một số điểm biên không phù họp, lúc này số lượng biên trên ảnh nhìn thấy sẽ ít đi Điều này đặc biệt có giá trị tốt để loại bỏ một số biên dư thừa đặc biệt với ảnh có nhiễu
Bước 4: Tiến hành thực hiện áp dụng ngưỡng (ngưỡng cao và ngưỡng thấp) đế loại bỏ một số cạnh xấu
Sau khi tiến hành bước 3, ta tiến hành áp dụng ngưỡng: sử dụng hai ngưỡng, ngưỡng cao Th và ngưỡng thấp T|
Những điểm biên được đánh dấu (không bị loại) ta tiếp tục tiến hành áp dụng ngưỡng cao va ngưỡng thấp:
+ Xét điểm ảnh I tại vị trí (x,y)
+ So sánh I(x,y) với hai ngưỡng Th và Ti
• Neu I(x,y) > Thi đánh dấu và giữ lại điểm biên (đặt giá trị bằng 1)
• Nếu I(x,y) < T|I loại bỏ điểm biên (đặt giá trị bàng 0)
• Neu T| < I(x,y) < Tj,: ta tiến hành so sánh giá trị I(x,y) với giá trị của các điểm của 8 điểm lân cận:
Neu một trong 8 điểm lân cận có giá trị > Thi tiến hành đánh dấu và giữ lại điểm biên
Ngược lại: loại bỏ điểm biên (đặt giá trị bàng 0)
Hình 2.18 là ví dụ về kết quả sau khi thực hiện phương pháp phát hiện biên Canny:
Trang 33KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
H ìn h 2.18 B iên ảnh theo p h ư ơ n g p h á p C a n n y
Phương pháp Canny được sử dụng rất nhiều trong các úng dụng của xừ
lý ảnh do đây là phương pháp có khả năng loại bỏ nhiễu rât tôt
Phương pháp Canny với độ lệch tiêu chuẩn ơ khác nhau và các ngưỡng khác nhau cho kết quả có sự khác nhau
Khi thay đổi độ lệch tiêu chuẩn ơ thì ảnh kết quả cũng thay đôi Càng tăng độ lớn của độ lệch tiêu chuẩn thì số lượng các điêm biên xác định được càng giảm N ghĩa là đối với ảnh có nhiều nhiễu, càns tăng độ lệch tiêu chuẩn thì số lượng điểm nhiễu cũng giảm đi, khi đó chi những biên
rõ nét mới phát hiện ra
Khi thay đổi ngưỡng thấp và ngưỡng cao, số lượng điểm biên được phát hiện cũng thay đổi Do các điểm ảnh có giá trị nhỏ hơn ngưỡng thấp, loại điêm đó và lớn hơn ngưỡng cao xác định đó là điêm biên (giữa hai ngưỡng còn tùy thuộc vào các điểm biên lân cận) Vậy:
+ Khi ngưỡng thấp và ngưỡng cao đều thấp: số lượnc điểm biên được phát hiện rất nhiều
+ Khi cả hai ngưỡng đều cao: số lượng điểm biên được phát hiện là rất
ít, chỉ những điêm có mức xám cao mới có thể là biên
+ Khi ngưỡng rất thấp và ngưỡng rất cao, nghĩa là khoảng cách giữa hai ngưỡng lớn thì điêm biên phụ thuộc vào các điểm lân cận
kết quà khác nhau
Trang 34Phần2. MỘT SỐ KỸ THUẬT PHÁT HIỆN NGƯỜI ĐI BỘ TRONG ẢNH
2.1.2 Nghiên cứu tổng quan về bài toán phát hiện người đi bộ trong ảnh
2.1.2.1 C ác kết qu ả và h ư ó ìig nghiên cứu trên thế giới hiện nay
Phát hiện người đi bộ là yêu cầu cấp thiết của hầu hết các hệ thống giám sát an ninh, cảnh báo an ninh Ket quả phát hiện sẽ là khâu tiên quyết trong việc kích hoạt các thiết bị cảnh báo Hệ thống giám sát an ninh, cảnh báo an ninh được sử dụng rộng rãi trên nhiều lĩnh vực như: ngân hàng, các cửa hàng, sân bay, bãi đỗ xe, Mục đích là phân tích các dừ liệu và cảnh báo an ninh, đưa ra cảnh báo kịp thời Trên thế giới hiện nay,
đã có một số hệ thống có chức năng cảnh báo khi phát hiện người đi bộ
ví dụ: hệ thống cảnh báo đặt trên xe ôtô: đầu tiên là xe Mercedes - Benz
E - Class (Hình 1.19), đến năm 2011, thêm một số xe ôtô được trang bị
hệ thống phát hiện người đi bộ: xe Volvo XC60, S60 và V60
c)
H ìn h 2.19 D e m o hệ thống bảo vệ trên xe M erce d e s - B enz E - C lass
Trang 35KỸ THUẬT XỬ LÝ ẢNH, ỨNG DỤNG TRONG THỰC TIỄN
Tập đoàn điện tử Toshiba của Nhật Bản phát triển hệ thống camera lâp trên xe ôtô nhận biết người đi bộ trong thời gian ngấn Theo Toshiba, hệ thống cam era này có thể sử dụng một phàn mềm đặc biệt ciúp thu thập thông tin về các sự vật thông qua hình ảnh rồi từ đó nhận biết con người Vào ban ngày, hệ thống này giúp lái xe nhận biẻt chính xác trên 99% Toshiba cho biết thử nghiệm thực tế cho thấy tỷ lệ sai sót cùa hệ thống này là 0.75%, đáp ứng được tiêu chuẩn cho phép
Hiện nay trên thế giới có hàng loạt các nghiên cứu tập trung giãi quyết bài toán phát hiện người đi bộ trong ảnh theo nhiều hướne khác nhau Tựa trung lại, có một số hướng tiếp cận cơ bàn sau:
- Dựa trên cách thức trích chọn đặc trưng thông thườrm được áp dụngtheo hai hướng:
+ Dựa trên các đặc trưng biến đổi Wavelet, Haar - Like và phân loại
đa cap: W avelet là phép biến đổi được sử dụng đê chuân hóa các vùng liên thông Sừ dụng phương pháp trích chọn đặc trưng
W avelet Haar để chọn tập đặc trưng cho mồi ả*ih vảo Các đặc trưng trích chọn được chứng minh là bất biến
+ Dựa trên đặc trưng Histogram có hướng (HOG - Histogram of Oriented gradient): HOG là một phân bố biểu đồ mức xám được sừ dụng để trích chọn đặc trưng của ảnh HOG tò ra khá hiệu quà trong các bài toán phát hiện người đi bộ trong ảnh [2], HOG được
đề xuất bởi Bill Triggs và Navel Dalai vào năm 2005 tại Viện Nghiên cứu INRIA HOG có ưu điểm là có thể tính toán nhanh, đặc trưng này giúp cho hệ thống hoạt động hiệu quà ở môi trường điều kiện chiếu sáng khác nhau vì HOG tương đối độc lập với điêu kiện chiếu sáng
- Dựa trên cách thức nhận dạng đối tượng:
+ Hướng tiếp cận phát hiện từng phần rồi tổ hợp lại, tronc đó cho phép tiến hành đồna thời các cônu đoạn (kỹ thuật Top - Down): người đi bộ được mô hình hóa thành từng bộ phận Phát hiện tưng
Trang 36Phẩn2. MỘT SỔ KỸ THUẬT PHAĩ hiện người đi bộ t r o n g ảnh
phần của người đi bộ (ví dụ: đầu, thân trên, thân dưới, ) sau đó tổng hợp kết quả, kết luận có phải người đi bộ hay không
+ Hướng tiếp cận phát hiện toàn bộ đối tượng (Full body detection) dựa trên các đặc trưng tổng thể của đối tượng để tìm kiếm: phát hiện người đi bộ trong các cửa sổ tìm kiếm địa phương nếu thòa mãn các tiêu chí nhất định Hạn chế của phương pháp này là hiệu suất dễ bị ảnh hưởng bởi nền lộn xộn và sự che lấp
2.I.2.2 P h ạ m vi ú n g d ụ n g thực tế của bài toán p h át hiện n g ư ò i đi
bộ tron g ảnh
Bài toán phát hiện nhanh đối tượng trong ảnh là: tìm kiếm đổi tượng của một lớp đã định nghĩa từ trước trong ảnh tĩnh Yêu cầu cùa bài toán là: phát hiện đối tượng ở các kích thước, góc độ và trạng thái chuyển động/đứng yên khác nhau; xử lý theo thời gian thực
Phát hiện người đi bộ trong ảnh là một bài toán khó trong bài toán phát hiện đối tượng
Mục đích là nghiên cứu phát hiện người đi bộ trong ảnh - mức cơ bàn, rồi từ đó phát triển, phát hiện người đi bộ trong video hay camera, bởi với dữ liệu thu được từ camera hay video thì bản thân chúng là tập hợp các ảnh liên tiếp nhau Từ nghiên cứu phát hiện người đi bộ trong ảnh
sẽ không khó khăn để phát hiện người đi bộ trong video hay camera.Phát hiện người đi bộ trong ảnh có thể được ứng dụng trong các hoạt động giám sát, các hệ thống nhúng
Đối với hệ thống giám sát, ví dụ hệ thống giám sát giao thônc, hiện nay, một số tuyến đường ở Hà Nội có sử dụng hệ thống đèn giao thông ưu tiên cho người đi bộ Người đi bộ nhấn nút bấm xin đường như hình 2.20
báo nhường đường cho người đi bộ vẫn thực hiện thù công Từ yêu cầu thực tiễn, hệ thống nên được thiết kế tự động: tự phát hiện người đi bộ (với số lượng hợp lý, thời gian hợp lý) chuyển tín hiệu đèn uiúp cho người di bộ saim đường một cách an toàn