KHOA CÔNG NGH THÔNG TIN THUY T MINH TÀI D NG LPQ LOCAL PHASE QUANTIZATION Ch nhi m đ tài: TS... Ph ng pháp trích ch n đ c tr ng LPQ Local Phase Quantization ...
Trang 1KHOA CÔNG NGH THÔNG TIN
THUY T MINH
TÀI
D NG LPQ (LOCAL PHASE QUANTIZATION)
Ch nhi m đ tài: TS NGUY N H U TUÂN
Thành viên tham gia: ThS NGUY N V N TH Y
H i Phòng, tháng 4 / 2016
Trang 2i
M U 1
1 Tính c p thi t c a v n đ nghiên c u 1
2 T ng quan v tình hình nghiên c u thu c l nh v c đ tài 1
3 M c tiêu, đ i t ng, ph m vi nghiên c u 1
4 Ph ng pháp nghiên c u, k t c u c a công trình nghiên c u 2
5 K t qu đ t đ c c a đ tài 2
CH NG 1: C S LÝ THUY T C A NH N D NG M T NG I 4
1 Bài toán nh n d ng m t ng i – nh ng v n đ c b n 4
1.1 Gi i thi u 4
1.2 Thách th c trong nh n d ng m t ng i 5
1.3 Các cách ti p c n cho bài toán nh n d ng m t ng i 6
CH NG 2: CÁC THÀNH PH N C A M T H TH NG NH N D NG M T T D NG 10
1 H th ng nh n d ng m t t đ ng 10
2 Phát hi n m t ng i s d ng đ c tr ng HOG 11
3 Chu n hóa ánh sáng v i b l c Retinal filter 15
4 Ph ng pháp trích ch n đ c tr ng LPQ (Local Phase Quantization) 17
5 B phân l p k-NN 20
CH NG 3: XÂY D NG H TH NG 23
1 Th vi n OpenCV và dlib 23
1.1 Th vi n OpenCV 23
1.2 Th vi n dlib 26
2 D li u và giao th c đánh giá hi u n ng c a h th ng 30
Trang 33 K t qu nh n d ng 32
K T LU N 34 TÀI LI U THAM KH O 36
Trang 4iii
DANH SÁCH B NG BI U
B ng 3.1: So sánh t l nh n d ng c a h th ng đ xu t v i các k t qu đã công
b khác 32
Trang 5DANH SÁCH HÌNH NH
Hình 1.1: Các thông tin có trong nh m t ng i 5
Hình 1.2: Các b c trong m t h th ng nh n d ng m t 8
Hình 2.1: Các b c trong h th ng nh n d ng m t t đ ng 10
Hình 2.2: nh input và hai đ o hàm c a nó 12
Hình 2.3: nh input và k t qu phát hi n và c n ch nh nh m t v i HOG 14
Hình 2.4: Các b c trong b l c Retinal filter 15
Hình 2.5: K t qu c a vi c ti n x lý v i b l c Retina filter 17
Hình 2.6: M t s nh LPQ thu đ c t các toán t LPQ 19
Hình 2.7: Các b c trong ph ng pháp trích ch n đ c tr ng LPQ 20
Hình 2.8: Minh h a b phân l p kNN 21
Hình 3.1: C u trúc c a th vi n OpenCV 23
Hình 3.2: C u trúc c a th vi n dlib 27
Hình 3.3: M t s nh m t ng i t c s d li u FERET 31
Hình 3.4: M t s k t qu v phát hi n m t ng i trong CSDL FERET 32
Trang 6LPQ – Local Phase Quantization 2
FERET – FacE Recognition Technology 3
PCA – Principal Components Analysis 6
LDA – Linear Discriminant Analysis 7
Trang 7M U
1 Tính c p thi t c a v n đ nghiên c u
Nh n d ng m t là bài toán có nhi u ng d ng trong th c t và nh n đ c
s quan tâm l n t c ng đ ng các nhà khoa h c nghiên c u v Th giác máy tính trong th i gian g n đây M t h th ng nh n d ng m t có nhi u b c và m i b c
l i là m t l nh v c nghiên c u v i các cách ti p c n khác nhau Do vây, h u h t các nghiên c u đ u th c hi n các th c nghi m trên các c s d li u chu n, có
s n các d li u c n thi t, mà không t p trung vào vi c xây d ng m t h th ng t
đ ng nh n d ng t các d li u thô ban đ u (các nh m t ch a qua x lý).
2 T ng quan v tình hình nghiên c u thu c l nh v c đ tài
Hi n nay các nghiên c u v nh n d ng m t đ c chia thành các h ng ti p
c n khác nhau cho t ng khâu c a m t h th ng hoàn ch nh v n g m có nhi u
b c, m i b c có m t ch c n ng và nh h ng khác nhau t i hi u n ng chung
c a h th ng Các th nghi m v t l nh n d ng c a các cách ph ng pháp đ
xu t th ng đ c ti n hành trên các t p d li u đ c thu nh n trong đi u ki n h n
ch v ánh sáng, h ng, …, do đó khi áp d ng vào th c t thì k t qu thu đ c
th ng kém xa so v i môi tr ng th nghi m Chính vì v y, trong đ tài này, chúng tôi t p trung vào vi c xây d ng m t h th ng t đ ng nh n d ng và th nghi m v i các đi u ki n nh thu nh n đ c trong các đi u ki n th c t
3 M c tiêu, đ i t ng, ph m vi nghiên c u
M c tiêu c a đ tài là xây d ng m t h th ng nh n d ng m t hoàn toàn t
đ ng v i d li u đ u vào là các nh m t ng i s d ng LPQ, m t ph ng pháp trích ch n đ c tr ng nh m t có kh n ng làm vi c t t v i các nh b m hay b
nh h ng b i ánh sáng H th ng s g m các module th c hi n: phát hi n vùng
nh m t, ti n x lý, trích ch n đ c tr ng, h c và nh n d ng
Trang 84 Ph ng pháp nghiên c u, k t c u c a công trình nghiên c u
Nh m xây d ng m t ch ng trình nh n d ng m t t đ ng, đ tài th c hi n nghiên c u các v n đ sau:
+ Nghiên c u k thu t phát hi n nh m t d a trên đ c tr ng HOG (Histogram of Oriented Gradients)
+ Nghiên c u k thu t ti n x lý đ chu n hóa nh m t
+ Nghiên c u áp d ng LPQ (Local Phase Quantization) cho bài toán nh n
+ Chu n hóa đi u ki n ánh sáng c a các nh m t ng i sau b c phát hi n
và c n ch nh b ng k thu t retina filter
+ Trích ch n đ c tr ng c a nh m t nh m bi u di n các b c nh thành các vector đ c tr ng s d ng ph ng pháp trích ch n đ c tr ng LPQ, m t ph ng pháp cho k t qu nh n d ng t t trong nhi u đi u ki n khó kh n, ch ng h n nh thay đ i c a ánh sáng và nh b m
+ S d ng ph ng pháp phân l p kNN (k-nearest neighbors) cho b c nh n
Trang 9s d li u nh m t ng i công c ng FERET (FacE Recognition Technology) và
so sánh v i các k t qu đã công b c a các ph ng pháp có liên quan K t qu so sánh cho th y r ng h th ng đ xu t có hi u n ng khá t t đ i v i các nh m t có góc nhìn th ng đ c thu nh n trong các đi u ki n trong nhà và có ki m soát
M c dù v y khi so sánh v i các h th ng bán t đ ng thì k t qu nh n d ng
c a h th ng v n ch a cao b ng i u này là h p lý vì vi c c n ch nh nh trong các h th ng bán t đ ng d a trên các t a đ c a m t ng i đ c xác đ nh b ng tay v n cho k t qu chính xác cao h n so v i vi c phát hi n và c n ch nh t đ ng
Trang 10CH NG 1:
C S LÝ THUY T C A NH N D NG M T NG I
1 Bài toán nh n d ng m t ng i – nh ng v n đ c b n
1.1 Gi i thi u
Nh n d ng m t ng i (Face recognition) là m t ch đ nghiên c u thu c
l nh v c th giác máy tính (Computer Vision) đã đ c phát tri n t đ u nh ng
n m 90 c a th k tr c [1] Cho t i hi n nay, đây v n là m t ch đ nghiên c u
m nh n đ c s quan tâm c a nhi u nhà nghiên c u t nhi u l nh v c nghiên
c u khác nhau nh nh n d ng m u (Pattern Recognition), h c máy (Machine Learning), th ng kê (Statistics), sinh tr c h c (Biometrics) i u này là do có r t nhi u ng d ng th c t c n t i m t h th ng nh n d ng m t, t các h th ng qu n
lý đ ng nh p đ n gi n cho t i các ng d ng giám sát t i các đ a đi m công c ng (public areas surveillance) ho c qu n lý dân s (population management) và pháp
lý (forsensics) Bên c nh đó, so v i các h th ng nh n d ng d a trên các đ c đi m sinh tr c h c khác c a con ng i, nh nh n d ng m ng m t và vân tay (fingerprint and iris recoginitions), dáng đi (gait recognition), nh n d ng m t có nhi u u
đi m:
+ M t h th ng nh n d ng m t không đòi h i có s t ng tác tr c ti p gi a
đ i t ng đ c nh n d ng và h th ng
+ Vi c thu nh n d li u ( nh m t) cho quá trình nh n d ng m t con ng i
d th c hi n h n so v i thu nh n các đ c đ c đi m sinh tr c h c khác (nh thu
nh n d u vân tay và m ng m t)
+ D li u v m t ng i ph bi n h n so v i các đ c tr ng khác do s bùng
n các m ng xã h i (facebook, twitter …), các d ch v chia s d li u đa ph ng
ti n (youtube, vimeo …) và s phát tri n m nh m c a các thi t b thu nh n hình
nh
+ T nh khuôn m t c a m t ng i ta có th khai thác nhi u thông tin liên quan ch không ch là danh tính, ch ng h n nh gi i tính (gender), màu da (skin
Trang 11color), h ng nhìn (gaze direction), ch ng t c, hành vi, s c kh e, đ tu i, c m xúc và m c đ thông minh … (xem thêm trong hình minh h a 1.1)
Hình 1.1: Các thông tin có trong nh m t ng i
1.2 Thách th c trong nh n d ng m t ng i
Tuy nhiên vi c xây d ng m t h th ng nh n d ng m t hoàn toàn t đ ng
v i kh n ng nh n d ng chính xác cao th c s là m t thách th c đ i v i các nhà nghiên c u i u này là do các y u t (ch quan và khách quan) nh h ng t i quá trình thu nh n nh và t o ra các b c nh có đ khác bi t r t l n c a cùng m t khuôn m t Có th li t kê ra đây các y u ch y u nh h ng t i đ chính xác c a
l n là s d ng các thu t toán n i suy đ c g ng bù đ p ph n khuôn m t b che khu t
Trang 12+ c m xúc (facial expresion variations) các tr ng thái c m xúc khác nhau, các đ c đi m quan tr ng cho nh n d ng m t (nh m t, m i, m m) có th b bi n
d ng (deformed) và d n t i các k t qu nh n d ng sai
+ che khu t (occlusions) Các nh m t có th b che khu t b i các y u t khách quan nh v t ch n tr c m t ho c ch quan nh các ph ki n trên khuôn
m t (kh n, kính m t) và làm cho quá trình nh n d ng b sai
Các h th ng nh n d ng m t đ c chia thành hai lo i: xác đ nh danh tính (face identification) và xác th c (face verification) Bài toán xác đ nh danh tính là bài toán d ng 1-N trong đó h th ng s đ a ra k t qu là danh tính c a nh đ c
nh n d ng d a trên s t ng đ ng c a nh input v i m t danh sách N nh đã bi t danh tính chính xác Trong khi đó, bài toán xác th c danh tính, h th ng s đ a
ra câu tr l i đúng ho c sai d a vào vi c xác đ nh xem 2 b c nh có thu c v cùng
m t ng i hay không Trong ph m vi c a đ tài này, chúng tôi ch t p trung vào bài toán xác đ nh danh tính
1.3 Các cách ti p c n cho bài toán nh n d ng m t ng i
D a vào vi c s d ng các đ c tr ng c a khuôn m t trong khi nh n d ng, các h th ng nh n d ng m t đ c chia thành hai h ng ti p c n chính: h ng ti p
c n toàn c c (global approaches) và h ng ti p c n c c b (local features based approaches) [2] Các ph ng pháp theo h ng ti p c n toàn c c s s d ng các
đ c đi m toàn c c c a khuôn m t (hình d ng, màu s c, các đ ng nét chính …) trong khi các h th ng theo cách ti p c n d a vào các đ c tr ng c c b s d ng các đ c đi m c c b c a khuôn m t (các đi m nh, các chi ti t nh m t, m i, m m, lông mày …) đ nh n d ng Trong s các h th ng nh n d ng m t d a trên các
đ c đi m toàn c c Eigengaces [3] và Fisherfaces [4] là các h th ng tiêu bi u nh t Eigenfaces s d ng phép phân tích thành ph n chính PCA (Principal Components Analysis) đ bi u di n m i nh m t nh là m t t h p tuy n tính c a các vector riêng thu đ c t phép phân gi i ma tr n hi p ph ng sai đ c tính t các nh
m t sau khi đã chu n hóa Do PCA là m t thu t toán h c không có giám sát nên không t n d ng đ c các thông tin v l p khi t p nh hu n luy n có nhi u h n 1
Trang 13m u cho m i l p nên trong Fisherfaces ph ng pháp phân tích tuy n tình khác
bi t LDA (Linear Discriminant Analysis) đã đ c s d ng nh m khai thác t t h n các thông tin này V các h th ng nh n d ng m t d a trên các đ c đi m c c b thì ph ng pháp m u nh phân c c b LBP (Local Binary Pattern) [5] và bi n đ i sóng nh Gabor (Gabor wavelets) [6] là các k thu t đi n hình dùng đ trích xu t các đ c đi m c c b t nh m t
Các nghiên c u cho th y các h th ng d a trên các đ c đi m c c b cho k t
qu t t h n các h th ng theo cách ti p c n toàn c c, đ c bi t là khi làm vi c v i các nh b nh h ng b i các đi u ki n nh đã đ c p trên M t cách ti p c n khác là k t h p c hai đ c tr ng c c b và toàn c c đ nh n đ c m t h th ng lai ghép (hybrid system) nh m đ t đ c hi u qu cao h n H th ng đ c xây
d ng trong tài li u này d a trên các đ c tr ng c c b
V c b n, m t h th ng nh n d ng m t ng i làm vi c gi ng nh h th ng
th giác c a con ng i khi c n nh n d ng (nh n ra) m t ai đó khi nhìn vào m t
b c nh b c đ u tiên h th ng c n xác đ nh xem có m t ng i trong b c nh input hay không, sau đó n u có thì ch vùng nh đó s đ c quan tâm, x lý, b c này g i là phát hi n khuôn m t (face detection) Ti p đ n, các đ c đi m là đ c
tr ng nh t c a khuôn m t (giúp phân bi t nh m t ng i này v i ng i khác và các nh thu c v cùng m t ng i) s đ c trích ch n (extract) đ nh n d ng, b c này g i là trích ch n đ c tr ng (feature extraction) Trong b c ti p theo, g i là
nh n d ng (recognition), h th ng s đ i sánh các đ c tr ng v a nh n đ c v i
m t kho d li u các đ c tr ng c a nh ng ng i đã bi t rõ danh tính đ xác đ nh xem các đ c tr ng đó là c a khuôn m t này và đ a ra k t lu n v danh tính t ng
ng v i khuôn m t có t l t ng đ ng l n nh t T l các nh nh n d ng đúng danh tính (so v i d li u th c t ) trên t ng s nh c n nh n d ng g i là t l nh n
d ng (recognition rate) và đ c dùng đ đánh giá hi u n ng (đ chính xác) c a
m t h th ng nh n d ng
Trang 14Hình 1.2 : Các b c trong m t h th ng nh n d ng m t
Trên th c t , vi c xây d ng m t h th ng nh n d ng m t s g m nhi u b c chi ti t h n nh đ c ch ra trong hình 1.2 Tr c b c trích ch n đ c tr ng, m t thu t toán ti n x lý (preprocessing) s đ c s d ng đ th c hi n l c nhi u và chu n hóa các đi u ki n ánh sáng c a các b c nh sao cho chúng có cùng đi u
ki n ánh sáng nh t có th Ti p đó, sau b c trích ch n đ c tr ng, m i nh m t s
đ c bi u di n d i d ng m t vector đ c tr ng có s chi u l n (t vài nghìn cho
t i hàng tr m nghìn) và ch a nhi u thông tin d th a, không c n thi t cho quá trình nh n d ng Do đó, m t thu t toán h c s đ c s d ng đ lo i b các đ c
đi m d th a và đ ng th i làm t ng tính phân bi t (discriminative) c a các thu c tính đ c gi l i nh m làm t ng hi u n ng c a h th ng v c t c đ x lý (do ch
c n làm vi c v i các vector có s chi u nh h n r t nhi u) và đ chính xác Cu i cùng, b c nh n d ng (classification stage), có nhi u thu t toán có th s d ng,
ch ng h n nh b phân l p k-láng gi ng g n nh t (k Nearest Neighbors – k-NN), SVM (Support Vector Machine) ho c m ng n ron (neural network)
Do m t h th ng nh n d ng m t g m nhi u b c nên các nghiên c u v
nh n d ng m t c ng chia thành các l nh v c nh h n ch t p trung vào các ph ng pháp đ gi i quy t t ng b c trong c h th ng Vì th , m c dù đã có nhi u nghiên
c u v nh n d ng m t, song vi c xây d ng hoàn ch nh m t h th ng hoàn toàn t
đ ng t b c đ u tiên t i cu i cùng v n còn ch a nhi u Trong đ tài này, chúng tôi h ng t i vi c xây d ng m t h th ng nh n d ng m t hoàn toàn t đ ng v i các k thu t đ c áp d ng cho các b c nh sau:
Trang 15+ phát hi n khuôn m t: s d ng các đ c tr ng HOG (Histogram of Oriented Gradients) [7]
s trình bày chi ti t v các k thu t đ c áp d ng khi tri n khai h th ng
Trang 16M c tiêu c a đ tài này là xây d ng m t h th ng nh n d ng m t t đ ng
v i các b c đ c mô t nh trong hình 2.1 T nh input, các nh m t ng i s
đ c phát hi n b ng cách s d ng các đ c tr ng HOG (Histogram of Oriented Gradient) Sau đó ph ng pháp chu n hóa ánh sáng Retinal filter s đ c s d ng
đ gi m b t các nh h ng x u c a ánh sáng t i hi u n ng nh n d ng b c trích ch n đ c tr ng, ph ng pháp Local Phase Quantization (LPQ) s đ c s
d ng đ trích xu t các đ c tr ng quan tr ng nh t c a m i b c nh m t B phân
l p kNN (k=1) s đ c s d ng b c phân l p trong đó hàm Chi Square s
đ c dùng đ đánh giá đ t ng đ ng c a các nh m t theo công th c sau:
trong đó X=[x1, x2, …, xM] và Y = [y1, y2, …, yM] là hai vector đ c tr ng t ng
ng v i 2 b c nh m t
Trong các ph n ti p theo c a ch ng này chúng tôi s trình bày chi ti t các b c
c a các thu t toán đ c s d ng cho h th ng nh n d ng m t t đ ng
Trang 172 Phát hi n m t ng i s d ng đ c tr ng HOG
Các đ c tr ng HOG [7] ban đ u đ c thi t k đ phát hi n ng i (human detection) trong d li u nh nh ng sau đó đ c m r ng và đ c s d ng r ng rãi cho các bài toán phát hi n đ i t ng nói chung (object detection) Ph ng pháp HOG d a trên vi c đ m s l n xu t hi n c a các h ng đ o hàm (gradient orientation) trong các vùng c c b c a nh
B n ch t c a ph ng pháp HOG là các thông tin v hình dáng và v b ngoài c a các đ i t ng c c b trong nh có th đ c mô t b ng cách s d ng thông tin v s phân b c a các c ng đ gradient (intensity gradients) ho c c a các h ng biên (edge directions) Các toán t HOG đ c cài đ t b ng cách chia
nh m t b c nh thành các vùng con đ c g i là các “t bào” (cells) và v i m i
cell đó m t histogram v các h ng c a gradients s đ c tính cho các đi m n m trong cell Ghép các histogram này l i ta s có m t bi u di n cho b c nh ban đ u
t ng c ng hi u n ng nh n d ng, các histogram c c b có th đ c chu n hóa
v đ t ng ph n b ng cách tính m t ng ng c ng đ trong m t vùng l n h n
c a nh, g i là các kh i (blocks) và s d ng giá tr ng ng đó đ chu n hóa t t c các cell trong kh i K t qu c a b c chu n hóa này là vector đ c tr ng s có tính
b t bi n cao h n đ i v i các thay đ i v đi u ki n ánh sáng
Các b c c b n c a vi c tính m t vector HOG cho m t nh g m có: Tính gradient, gán h ng vào các vùng giá tr khác nhau, tính histogram c a các kh i
và cu i cùng là chu n hóa các kh i
Tính gradient: ây là b c đ u tiên trong ph ng pháp HOG và th ng
đ c th c hi n b ng hai phép nhân ch p nh g c v i 2 nhân 1 chi u t ng ng
v i các toán t l y đ o hàm nh theo hai h ng Ox và Oy, c th là:
Dx= [-1 0 1] và Dy= [1 0 -1]T, trong đó T là ký hi u c a phép chuy n v ma tr n
V i m t nh input I, ta s có 2 nh đ o hàm riêng theo 2 h ng đ c tính
b ng các công th c: Ix= I*Dx và Iy= I*Dy
Trang 18Thành ph n c ng đ (magnitude) và h ng (orientation) s đ c tính theo các công th c: |G| = sqrt(Ix2 + Iy ) và θ=arctan(Iy, Ix) Ví d v k t qu c a phép
l y đ o hàm có th xem hình sau:
Hình 2.2: nh input và hai đ o hàm c a nó
Gán h ng: Sau khi tính đ o hàm, ta có thành ph n h ng các đi m nh
trong m i cell c a nh input Các giá tr h ng này đ c chia thành các vùng
h ng đ u nhau trong kho ng t 0 t i 360o Theo các tác gi c a HOG, thì 9 vùng chia cho k t qu t t nh t đ i v i các bài toán nh n d ng Có ngh a là các giá tr
h ng n m trong kho ng [0, 360/9) s đ c gán b ng 1 (coi là nh nhau), các giá
tr h ng trong kho ng [360/9, 2*360/9) s đ c gán b ng 2, vân vân Sau đó histogram c a m i cell s đ c tính đ c l p
Tính histogram c a các kh i: đáp ng t t h n v i các thay đ i v đi u
ki n ánh sáng và đ t ng ph n, các giá tr gradient c n ph i đ c chu n hóa c c
b , đi u này đòi h i vi c nhóm các cell thành các vùng liên k t không gian v i nhau g i là các kh i Vector HOG do đó s là t ng h p các histogram c a các cell
đã đ c chu n hóa t t t c các kh i Các kh i s đ c chia và không tách bi t nhau, nói cách khác m i cell s đóng góp thông tin v các h ng (t i các đi m
nh c a nó) nhi u h n 1 l n
Chu n hóa kh i: Có nhi u ph ng pháp có th đ c dùng cho vi c chu n hóa kh i G i v là vector c n chu n hóa ch a t t c các histogram c a m t kh i,
Trang 19||v k|| là giá tr chu n c a nó theo các chu n k=1, 2 và e là m t h ng s nh , khi đó các giá tr chu n hóa có th tính b ng 1 trong các công th c sau:
và trích xu t các vector HOG t các nh này
B c 3: S d ng m t b phân lo i SVM tuy n tính đ h c v i các vector
c a các m u tích c c (là nh m t ng i) và tiêu c c (các nh không ph i m t
ng i) đã chu n b
B c 4: i v i m i b c nh trong b nh tiêu c c, s d ng m t c a s
tr t di chuy n qua t t c các v trí có th c a nh input T i m i v trí c a c a s
tr t, tính vector HOG c a c a s và đ a vào b phân l p N u b phân l p phân
l p sai m t c a s là nh m t thì ghi l i vector t ng ng cùng v i xác su t phân
l p
B c 5: L y các m u nh n d ng sai b c 4 và s p x p chúng theo m c
xác su t nh n d ng sai và cho b phân l p h c l i s d ng các m u sai này
Trang 20B c 6: Áp d ng b phân l p đã đ c h c l i v i các nh c n phát hi n
m t ng i
Trong đ tài này, toàn b ph n phát hi n m t ng i s d ng các d li u phân l p đã đ c h c tr c đ c cung c p b i th vi n dlib K t qu c a b c này có th xem các hình minh h a sau:
Hình 2.3: nh input và k t qu phát hi n và c n ch nh nh m t v i HOG
Trang 213 Chu n hóa ánh sáng v i b l c Retinal filter
B l c Retinal filter ban đ u đ c phát tri n nh m t b l c nh thông
th ng d a vào vi c mô ph ng các b c trong h th ng nh n d ng hình nh c a con ng i [8] Sau đó nó đ c áp d ng cho bài toán nh n d ng m t v i m c đích chu n hóa ánh sáng b c ti n x lý và đã ch ng t đ c tính hi u qu c a mình
V c b n b l c th c hi n mô ph ng ho t đ ng c a hai l p chính c a h
th ng th giác c a con ng i là l p Photoreceptor và Outer Plexiform b ng cách
áp d ng liên ti p hai hàm phi tuy n, b l c DoG và m t hàm c t h u x lý nh
v i m i đi m nh còn Y là nh output
T nh input I ban đ u, b l c Retinal filter s d ng hai b l c thông th p liên ti p v i công th c (xu t phát t công th c c a hàm Naka-Rushton trên) nh sau:
= (max( ) + ( )) ( )
( ) + ( )