Bài viết trình bày giải thuật theo vết nhiều đối tượng dựa trên cơ sở của lọc hạt theo chuỗi Markov Monte Carlo. Để tăng hiệu quả và chính xác của mô hình quan sát, chúng tôi đề nghị kết hợp hai nguồn thông tin dựa trên đặc trưng về màu sắc của đối tượng và ma trận tin cậy phát hiện tiền cảnh. Giải thuật lọc hạt với ước lượng phân bố theo chuỗi Markov Monte Carlo được áp dụng để giải quyết bài toán theo vết nhiều đối tượng. Mời các bạn cùng tham khảo!
Trang 1Theo vết đa đối tượng bằng giải thuật lọc hạt trên
cơ sở của chuỗi Markov Monte Carlo
Trương Công Dung Nghi∗, Chế Viết Nhật Anh∗, Hồ Phước Tiến† and Đỗ Hồng Tuấn∗
∗Khoa Điện-Điện tử, Trường Đại học Bách Khoa, Đại học Quốc Gia Tp.HCM
†Khoa Điện tử Viễn thông, Trường Đại học Bách Khoa, Đại học Đà Nẵng
Tóm tắt—Chúng tôi trình bày trong bài báo này giải thuật
theo vết nhiều đối tượng dựa trên cơ sở của lọc hạt theo chuỗi
Markov Monte Carlo Để tăng hiệu quả và chính xác của mô
hình quan sát, chúng tôi đề nghị kết hợp hai nguồn thông tin
dựa trên đặc trưng về màu sắc của đối tượng và ma trận tin
cậy phát hiện tiền cảnh Giải thuật lọc hạt với ước lượng phân
bố theo chuỗi Markov Monte Carlo được áp dụng để giải quyết
bài toán theo vết nhiều đối tượng Toàn bộ hệ thống được kiểm
nghiệm trên hai bộ cơ sở dữ liệu thông dụng với các tình huống
thực tế phức tạp Kết quả thực nghiệm cho thấy được hiệu quả
của giải thuật đề xuất.
Từ khóa—Theo vết đa đối tượng, lọc hạt (particle filtering),
chuỗi Markov Monte Carlo (Markov Chain Monte Carlo), phát
hiện tiền cảnh.
I GIỚI THIỆU Theo vết đối tượng trong video là một trong những vấn đề
cơ bản và quan trọng trong các ứng dụng của ngành thị giác
máy tính Vấn đề này có thể được xem là bước xử lý tiên khởi
trong nhiều ứng dụng quan trọng như hệ thống giám sát thông
minh, ứng dụng tương tác giữa người và máy, hay hệ thống
giám sát giao thông, Cho tới thời điểm này, đã và đang có
rất nhiều nghiên cứu cho vấn đề này [1], tuy nhiên việc xây
dựng một hệ thống hoàn toàn tự động theo vết nhiều đối tượng
với độ chính xác cao vẫn luôn là một thách thức lớn và đòi
hỏi những nghiên cứu cải tiến không ngừng
Các giải thuật theo vết nhiều đối tượng (Multiple Object
Tracking - MOT) thường được phân loại thành hai nhóm chính:
nhóm giải thuật xác định (deterministic methods) [2], [3] và
nhóm giải thuật dựa trên ước lượng xác suất (probabilistic
methods) [4], [5] Trong nhóm giải thuật ước lượng dựa trên
xác suất thì các phương pháp dựa trên cơ sở của việc lọc
hạt (particle filtering), được đề xuất lần đầu tiên bởi Isard và
Blake [6], cho được những kết quả khá khả quan
Đa số các giải thuật theo vết dựa trên cơ sở của lọc hạt
đều cố gắng cải thiện mô hình quan sát (observation models)
sao cho mô hình sử dụng hoạt động tốt trong điều kiện hình
dáng đối tượng thay đổi do di chuyển hay do thay đổi môi
trường, có sự che lấp và tương tác giữa các đối tượng Hướng
tiếp cận thông dụng nhất là xây dựng các mô hình đặc tả hình
dáng bên ngoài với khả năng thích nghi cao, như là sử dụng
histogram màu [7], [8], bộ trộn Gauss [9], [10], hay phối hợp
nhiều đặc tính khác nhau [11] Một vài hướng tiếp cận khác
đề xuất các phép biến đổi affine trong không gian trạng thái (state space model) [12], [13], [14], hoặc cải thiện bước lấy mẫu các hạt theo kiểu truyền thống [15], [4], [16]
Trong bài báo này, chúng tôi đề xuất giải thuật theo vết nhiều đối tượng với những tình huống thực tế phức tạp (các đối tượng có tương tác và bị che lấp một phần) Giải thuật đề xuất dựa trên ý tưởng xây dựng tập hợp các hạt theo mô hình chuỗi Markov Monte Carlo Để tăng độ chính xác của quá trình ước lượng, chúng tôi đề xuất kết hợp mô hình đặc trưng dựa trên đặc điểm màu sắc của đối tượng với ma trận xác suất thu được từ giải thuật phát hiện đối tượng tiền cảnh [17] Giải thuật lọc hạt theo mô hình chuỗi Markov Monte Carlo được áp dụng để ước lượng phân bố tiên quyết (posterior) các biến trạng thái của đối tượng, từ đó giải quyết bài toán theo vết các đối tượng trong khung ảnh Giải thuật đề xuất được kiểm nghiệm trên hai bộ cơ sở thông dụng là PETS’06 [18] CAVIAR [19] Kết quả thực nghiệm cho thấy tính hiệu quả và chính xác của giải thuật đề xuất trong các tình hướng thực tế phức tạp
Bài báo được trình bày với các mục chính như sau: trong mục II, chúng tôi trình bày cơ sở lý thuyết cũng như giải thuật
đề xuất cho việc theo vết nhiều đối tượng Mục III trình bày kết quả thực nghiệm thu được trên hai bộ cơ sở với các tình huống thực tế phức tạp Phần kết luận và hướng phát triển được trình bày trong mục IV
II CƠ SỞ LÝ THUYẾT Trong bài báo này, chúng tôi tập trung giải quyết bài toán theo vết nhiều đối tượng trong video, với các tình huống phức tạp trong thực tế bao gồm số lượng đối tượng thay đổi do di chuyển ra hoặc vào khung ảnh, các đối tượng có tương tác
và có thể bị che lấp một phần Đối với tình huống số lượng đối tượng thay đổi, chúng tôi sử dụng một tập hợp các biến
ek = [e k,1 · · · e k,N max] tượng trưng cho tình trạng hiện diện
của các đối tượng trong khung ảnh, với k tương ứng với thời điểm t k , và N maxlà số đối tượng tối đa có thể theo vết trong
khung ảnh Giá trị của e k,n (n = 1 N max)được định nghĩa như sau:
e k,n=
1 đối tượng n có trong khung ảnh
0 đối tượng n không có trong khung ảnh (1)
Trang 2Các đối tượng cần theo vết được đánh dấu bởi một khung
hình chữ nhật và được đặc trưng bởi biến vị trí - kích thước
Xk được định nghĩa như sau:
Xk=
x k,1 · · · x k,Nmax
y k,1 · · · y k,Nmax
rx k,1 · · · rx k,Nmax
ry k,1 · · · ry k,Nmax
với (x k,n , y k,n)là trọng tâm của hình chữ nhật tương ứng với
đối tượng cần theo vết, và (rx k,n , ry k,n) là độ lớn của hai
cạnh hình chữ nhật
Gọi Z 0:k là chuỗi các quan sát từ thời điểm t0 đến t k,
Sk ={X k , e k } là tập hợp biến trạng thái của các đối tượng
cần theo vết Bài toán theo vết nhiều đối tượng trong trường
hợp này tương ứng với việc ước lượng phân bố p(S k |Z 0:k)
của biến trạng thái Sk tại thời điểm t k khi có được chuỗi các
quan sát Z 0:k Đại lượng này có thể được biểu diễn một cách
đệ quy theo phương trình lọc Bayes:
p (S k |Z 0:k)∝
p (Z k |S k ) p (S k |S k −1)
p (S k −1 |Z 0:k −1 ) dS k −1 (3)
Với giả thiết các đối tượng cần theo vết di chuyển hoàn toàn
độc lập với nhau, đồng thời biến vị trí - kích thước Xk và
tình trạng hiện diện ek là hai biến độc lập, phân bố xác suất
biến đổi (transition probability distribution) p (S k |S k−1) =
p (X k , e k |X k−1 , e k−1)có thể được khai triển như sau:
p (X k , e k |X k −1 , e k −1 ) = p (X k |X k −1 , e k , e k −1 ) p (e k |e k −1)
=
Nmax
n=1
p (X k,n |X k −1,n , e k,n , e k −1,n ) p (e k,n |e k −1,n) (4)
với Xk,n = [x k,n , y k,n , rx k,n , ry k,n]T
Trong các mục tiếp theo, chúng tôi sẽ lần lượt định nghĩa các
đại lượng xác suất cần thiết để ước lượng phân bố p(S k |Z 0:k)
theo như phương trình (3)
A Phân bố tiên quyết của biến hiện diện e k
Trong giải thuật đề xuất, biến hiện diện ek được mô hình
theo chuỗi Markov rời rạc Hai trạng thái “xuất hiện” và “biến
mất” của đối tượng lần lượt được đặc trưng bởi các giá trị xác
suất P B và P D Xác suất thay đổi tình trạng hiện diện được
định nghĩa như sau:
p(e k,n |e k −1,n ) = δ(e k,n − 1)[(1 − P D )δ(e k −1,n − 1)
+ P B δ(e k −1,n )] + δ(e k,n)[(1− P B )δ(e k −1,n)
+ P D δ(e k −1,n − 1)] (5)
B Mô hình biến đổi vị trí - kích thước của các đối tượng
Xác suất biến đổi biến Xk,n của đối tượng thứ n có thể
được chia thành ba trường hợp tương ứng với cặp giá trị của
e k,n và e k−1,n như sau:
• Xuất hiện đối tượng mới: {e k,n , e k −1,n } = {1, 0}
Đối tượng mới có thể xuất hiện ở bất cứ vị trí nào trong khung ảnh Vì vậy xác suất biến đổi của biến Xk,ntrong trường hợp này được định nghĩa như sau:
p (X k,n |X k −1,n , e k,n , e k −1,n ) = p b(Xk,n)
∼ [U(1, N x ), U(1, N y ), N (rm x , σ x ), N (rm y , σ y)]T
(6)
với (N x , N y) là kích thước của khung ảnh,
(rm x , rm y , σ x , σ y) là các tham số cho trước ứng với giá trị trung bình và phương sai của kích thước khung hình chữ nhật đặc trưng cho đối tượng
• Cập nhật đối tượng: {e k,n , e k −1,n } = {1, 1}
Trường hợp này tương ứng với việc cập nhật trạng thái của một đối tượng đang tồn tại và được theo vết tại thời
điểm t n −1 Ở đây chúng tôi sử dụng phân bố Gauss cho việc cập nhật biến vị trí - kích thước:
p (X k,n |X k −1,n , e k,n , e k −1,n)
= p u(Xk,n |X k −1,n) =N (X k,n |X k −1,n , ΣX) (7) với ΣX là ma trận hiệp phương sai quy định vùng thay đổi xung quanh vị trí hiện tại
• Đối tượng biến mất: {e k,n , e k−1,n } = {0, 1}
Đối với trường hợp đối tượng ra khỏi khung ảnh, chúng tôi sẽ giữ biến trạng thái của đối tượng tại biến lưu trữ
Xd
C Mô hình quan sát
Để đánh giá độ chính xác/tương thích của vùng ứng cử với các đối tượng đang theo vết, chúng tôi xây dựng mô hình likelihood bằng cách kết hợp hai nguồn thông tin: độ tương tự dựa trên đặc trưng về màu sắc của các đối tượng theo vết và
ma trận likelihood thu được từ giải thuật phát hiện tiền cảnh
Mô hình đặc trưng dựa trên màu sắc: Chúng tôi sử
dụng mô hình đặc trưng được đề xuất trong [20] để đặc
tả vùng đối tượng theo vết Mỗi điểm ảnh được biểu diễn
bởi một vector đặc trưng s = [c, x, y], với c là vecor các thành phần màu đã được chuẩn hoá {R ∗ , G ∗ , B ∗ } = {R, G, B} − mean({R, G, B})
std ({R, G, B}) , và [x, y] là toạ độ của pixel
đang xét với điểm toạ độ gốc là điểm trên cùng bên trái hình chữ nhật Mật độ xác suất của vector đặc trưng s được ước
lượng bởi bộ trộn thích nghi gồm N s Gaussians:
f (s) =
N s
i=1
α i η (s |µ i , Σ i) (8)
Trang 3với α i là trọng số của thành phần thứ i, η (s|µ i , Σ i) là hàm
mật độ xác suất của phân bố chuẩn với vector trung bình µ i
và ma trận hiệp phương sai Σi
Các thành phần Gaussians trong mô hình đặc trưng được ước
lượng bằng cách sử dụng giải thuật tách/nhập mô tả trong [20]
Sự tương tự giữa một vùng ước lượng r e và mô hình tham
chiếu r o được định nghĩa như sau:
L C= exp
− d (r σ e2, r o)
(9)
với d (r e , r o)là khoảng cách giữa hai hàm mật độ xác suất:
d (r e , r o) =
s
f e (s)− f o (s)2
(10)
với f
(s) = f (s)
s
f (s)2
Ma trận likelihood từ giải thuật phát hiện tiền cảnh:
Thành phần thứ hai trong mô hình likelihood được dựa trên
ma trận likelihood thu được từ giải thuật phát hiện tiền cảnh
đề xuất trong [17] Giải thuật này mô hình hoá nền và tiền
cảnh thông qua bộ trộn Gauss với vector đặc trưng kết hợp cả
hai thành phần: màu sắc và không gian Ma trận likelihood
ước lượng từ hiệu log của hai hàm mật độ xác suất tương ứng
với nền và tiền cảnh được sử dụng trong phần này như một
ma trận đánh giá độ tin cậy của các vùng trong khung ảnh có
hiện diện đối tượng cần theo vết Hình 1 biểu diễn một trường
hợp của ma trận likelihood ứng với một khung ảnh tách từ
video cần thực hiện giải thuật theo vết
−10 0 10 20 30 40 50 60
Hình 1 Ma trận likelihood từ giải thuật phát hiện tiền cảnh (từ trái sang
phải: ảnh gốc, ma trận likelihood).
Với ma trận thu được từ giải thuật phát hiện tiền cảnh, mỗi
pixel khi này được đặc trưng bởi một giá trị, tạm gọi là điểm
tin cậy, đánh giá độ tin cậy pixel đang xét thuộc về miền tiền
cảnh hay không Cho trước vector ước lượng Xi
k,n của đối
tượng n, giá trị likelihood dựa trên ma trận phát hiện tiền
cảnh L D được định nghĩa là tổng điểm tin cậy của các pixel
trong vùng chữ nhật tương ứng
Như vậy, khi kết hợp cả hai nguồn thông tin vừa trình bày,
ta định nghĩa được giá trị likelihood của một vector ước lượng
Xi
k,n như sau:
p
Z kXi k
D Giải thuật theo vết bằng bộ lọc hạt dựa trên chuỗi Markov Monte Carlo
Như đã trình bày ở phần trên, giải thuật theo vết nhiều đối tượng có thể được xem tương ứng với việc ước lượng phân bố
p (S k |Z 0:k)với:
p (S k |Z 0:k)∝ p (Z k |S k ) p (S k |S k −1 ) p (S k −1 |Z 0:k −1)
(12)
Phân bố hậu nghiệm p (S k −1 |Z 0:k −1) tại thời điểm k − 1
được ước lượng dựa trên tập hợp các hạt (particle set)
{S(k−1 j) }:
p (S k −1 |Z 0:k −1)≈ N1
p
N p
j=1
δ
Sk −1 − S (j) k−1 (13)
với N p là tổng số hạt sử dụng trong giải thuật và (j) là chỉ
số của hạt
Giải thuật theo vết sử dụng lọc hạt dựa trên chuỗi Markov Monte Carlo bao gồm 2 bước chính: bước ước lượng kết hợp thực hiện việc cập nhật đồng thời biến trạng thái của các đối tượng, và bước tinh chỉnh thực hiện việc cập nhật độc lập biến trạng thái của từng đối tượng Hai bước này được lặp lại
(N b + N p)lần, với N b là độ dài khởi động và N p là số hạt dùng trong giải thuật Chi tiết của giải thuật tại ở lần lặp thứ
i tại thời điểm t k được mô tả như sau:
(i) Bước ước lượng kết hợp Trong bước ước lượng này, chúng
tôi thực hiện việc ước lượng mẫuX∗ k , X ∗ k −1 , e ∗ k , e ∗ k −1
thông
qua hàm q1( Xk , X k −1 , e k , e k −1 | Z 0:k)given by:
q1( Xk , X k −1 , e k , e k −1 | Z 0:k ) = q11(Xk |X k −1 , e k , e k −1)
q12(e k |e k−1 ) q13(Xk−1 , e k−1 |Z 0:k −1) (14)
với q11(Xk |X k −1 , e k , e k −1) and q12(e k |e k −1) là các hàm biến đổi trạng thái đã định nghĩa trong mục II-A và II-B,
q13(Xk−1 , e k−1 |Z 0:k −1) là ước lượng của phân bố hậu
nghiệm p (X k−1 , e k−1 |Z 0:k −1)ở thời điểm t k−1
Như vậy, giả sử tại thời điểm t k −1 , ta có N p mẫu
Xj k −1 , e j k −1N p
j=1 Với N p mẫu này, ta chọn ngẫu nhiên một mẫuX∗
k −1 , e ∗
k −1
, sau đó dựa trên các hàm biến đổi trạng thái đã định nghĩa trong mục II-A và II-B để có được mẫu
ước lượng mới {X ∗
k , e ∗
k } Mẫu ước lượng mới này có xác suất được chấp nhận là ρ1= min
1, p (Z k |S ∗
k)
p
Z k
Sm −1 k
(ii) Bước tinh chỉnh Ở bước này, chúng tôi đề xuất ước lượng
lần lượt các biến e k,n và Xk,n của từng đối tượng Biến e k,n
được ước lượng dựa trên hàm q2
e k,n
e m k−1,n
cho bởi công thức (5) Xác suất chấp nhận trong trường hợp này là:
ρ 2,n= min
1, p
Z k,n
e ∗ k,n , X ∗ k,n
p
Z k,n
e m k,n , X m k,n
Trang 4Biến Xk,n được tách thành 2 thành phần là trọng tâm
ck,n = [x k,n , y k,n]T và kích thước rk,n = [rx k,n , ry k,n]T
Thành phần trọng tâm ck,n được ước lượng bằng hàm sau:
q3
ck,n
cm
k−1,n , r m
k,n , r m k−1,n
=Nck,n
˜µ m k,n , ˜Σ
(16) với vector trung bình ˜m
k −1,n +
ΣX(12)
ΣX(22)−1
rm k,n − r m k−1,n
và ma trận hiệp phương sai ˜Σ = ΣX(11) − ΣX(12)
ΣX(22)
−1
ΣX(21)
với ΣX=
ΣX(11) ΣX(12)
ΣX(21) ΣX(22)
Xác suất chấp nhận cho giá trị ước lượng trọng tâm là:
ρ 3,n= min
1, p
Z k,n
c∗ k,n , r m k,n
p
Z k,n
Xm k,n
Quá trình ước lượng cho các giá trị kích thước hình chữ
nhật rk,ncũng được thực hiện tương tự với hàm ước lượng:
q4
rk,n
rm
k −1,n , c m
k,n , c m
k −1,n
=Nrk,n
ˆµ m k,n , ˆΣ
(18) với ˆµ m k,n= rm k −1,n+ ΣX(21)
ΣX(11)
−1
cm k,n − c m
k −1,n
and ˆ
Σ = ΣX(22)− ΣX(21)
ΣX(11)−1
ΣX(12) Xác suất chấp nhận cho thành phần này là:
ρ4= min
1, p
Z k,n
cm k,n , r ∗ k,n
p
Z k,n
Xm k,n
III KẾT QUẢ THỰC NGHIỆM
Trong mục này, chúng tôi trình bày kết quả thu được của
giải thuật đề xuất khi kiểm nghiệm với các đoạn video trích ra
từ hai bộ cơ sở dữ liệu thông dụng: bộ dữ liệu PETS’06 [18]
và bộ dữ liệu CAVIAR [19] Giải thuật thực hiện với tổng số
lượng hạt N p= 1500, độ dài khởi động Nb= 500và số đối
tượng theo vết tối đa N max= 6
Hình 2 trình bày kết quả thu được với đoạn video trích từ
bộ cơ sở dữ liệu CAVIAR Kết quả cho thấy giải thuật xử lý
tốt tình huống xuất hiện và biến mất của các đối tượng Ngoài
ra, với trường hợp các đối tượng có tương tác và bị che lấp
một phần như trong trường hợp này, kết quả thu được là rất
khả quan
Đối với đoạn video trích từ bộ dữ liệu PETS’06, trường
hợp này tương đối phức tạp hơn trường hợp trên: số lượng đối
tượng cần theo vết nhiều hơn, các đối tượng có hình dáng bên
ngoài giống nhau, tình huống tương tác giữa các đối tượng
cũng phức tạp hơn Kết quả thu được từ giải thuật cho thấy
giải thuật xử lý tốt tình huống xuất hiện của đối tượng mới
Tuy nhiên, kết quả vẫn có lỗi trong trường hợp các đối tượng
tương tác nhau, nhất là trong trường hợp này đặc điểm nhận
diện bề ngoài của các đối tượng là rất giống nhau (hình 3)
Hình 2 Kết quả theo vết thu được bởi giải thuật đề xuất với đoạn video trích
từ bộ cơ sở dữ liệu CAVIAR.
IV KẾT LUẬN Trong bài báo này, chúng tôi trình bày giải thuật theo vết nhiều đối tượng dựa trên cơ sở của lọc hạt theo mô hình chuỗi Markov Monte Carlo Chúng tôi đề xuất kết hợp hai nguồn thông tin về đặc điểm màu sắc của đối tượng theo vết và ma trận độ tin cậy phát hiện tiền cảnh nhằm tăng hiệu quả của mô hình quan sát Giải thuật theo vết được xây dựng trên nguyên
lý của lọc hạt với việc ước lượng theo chuỗi Markov Monte Carlo Giải thuật đề xuất được kiểm nghiệm trên hai cơ sở dữ liệu thông dụng với các tình huống phức tạp Kết quả thực nghiệm cho thấy hiệu quả và độ chính xác của giải thuật theo vết nhiều đối tượng đã đề xuất
LỜI CẢM ƠN Nghiên cứu này được tài trợ bởi Quỹ phát triển khoa học và công nghệ quốc gia (NAFOSTED) trong đề tài mã số 102.99-2013.36
Trang 5Hình 3 Kết quả theo vết thu được bởi giải thuật đề xuất với đoạn video trích
từ bộ cơ sở dữ liệu PETS’06.
TÀI LIỆU THAM KHẢO
[1] A Yilmaz, O Javed, and M Shah, “Object tracking: A survey,” ACM
Computing Surveys, vol 38, no 4, pp 1–45, 2006.
[2] V Takala and M Pietikainen, “Multi-object tracking using color, texture
and motion,” in IEEE Conference on Computer Vision and Pattern
Recognition, 2007, pp 1–7.
[3] D.-N Truong Cong, N.-A Che Viet, and T Ho-Phuoc, “Rule-based
multiple object tracking,” in International Conference on Advanced
Technologies for Communications, 2014.
[4] Z Khan, T Balch, and F Dellaert, “Mcmc-based particle filtering for
tracking a variable number of interacting targets,” IEEE Transactions
on Pattern Analysis and Machine Intelligence, vol 27, pp 1805–1918,
2005.
[5] D.-N Truong Cong, F Septier, C Garnier, L Khoudour, and
Y Delignon, “Robust visual tracking via mcmc-based particle filtering,”
in IEEE International Conference on Acoustics, Speech and Signal
Processing, 2012.
[6] M Isard and A Blake, “Condensation-conditional density propagation
for visual tracking,” International Journal of Computer Vision, vol 29,
no 1, pp 5–28, 1998.
[7] P Pérez, C Hue, J Vermaak, and M Gangnet, “Color-based
probabilis-tic tracking,” in European Conference on Computer Vision Springer,
2002, pp 661–675.
[8] K Nummiaro, E Koller-Meier, and L Van Gool, “An adaptive
color-based particle filter,” Image and Vision Computing, vol 21, no 1, pp.
99–110, 2003.
[9] S Zhou, R Chellappa, and B Moghaddam, “Visual tracking and
recognition using appearance-adaptive models in particle filters,” IEEE
Transactions on Image Processing, vol 13, no 11, pp 1491–1506, 2004.
[10] H Wang, D Suter, K Schindler, and C Shen, “Adaptive object tracking
based on an effective appearance filter,” IEEE Transactions on Pattern
Analysis and Machine Intelligence, vol 29, no 9, pp 1661–1667, 2007.
[11] L Jin, J Cheng, and H Huang, “Human tracking in the complicated
background by particle filter using color-histogram and hog,” in
Interna-tional Symposium on Intelligent Signal Processing and Communication Systems (ISPACS), 2010, pp 1–4.
[12] X Li, W Hu, Z Zhang, X Zhang, and G Luo, “Robust visual tracking
based on incremental tensor subspace learning,” in IEEE International
Conference on Computer Vision, 2007.
[13] D Ross, J Lim, R Lin, and M Yang, “Incremental learning for robust
visual tracking,” International Journal of Computer Vision, vol 77,
no 1, pp 125–141, 2008.
[14] J Kwon, K Lee, and F Park, “Visual tracking via geometric particle
filtering on the affine group with optimal importance functions,” in IEEE
Conference on Computer Vision and Pattern Recognition IEEE, 2009,
pp 991–998.
[15] W Gilks and C Berzuini, “Following a moving target–monte carlo
inference for dynamic bayesian models,” Journal of the Royal Statistical
Society: Series B (Statistical Methodology), vol 63, no 1, pp 127–146,
2001.
[16] S Pang, J Li, and S Godsill, “Models and algorithms for detection and
tracking of coordinated groups,” in IEEE Aerospace Conference IEEE,
2008, pp 1–17.
[17] D.-N Truong Cong, L Khoudour, C Achard, and A Flancquart, “Adap-tive model for object detection in noisy and fast-varying environment,”
in International Conference on Image Analysis and Processing, 2011,
pp 68–77.
[18] “Pets 2006,” http://www.cvg.rdg.ac.uk/PETS2006/data.html.
[19] “Caviar,” http://homepages.inf.ed.ac.uk/rbf/CAVIARDATA1/.
[20] D.-N Truong Cong, L Khoudour, C Achard, and L Douadi, “People
detection and re-identification in complex environments,” IEICE
Trans-actions on Information and Systems, vol E93-D, no 7, pp 1761–1772,
2010.