Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt được chia làm 3 chương chính. Chương 1: Tổng quan về hiện trạng các bài toán nhận dạng và thiết lập bài toán nghiên cứu; Chương 2: Tìm hiểu về mạng Neural và khoảng cách Hamming; Chương 3: Ứng dụng mạng neural Hamming trong bài toán nhận dạng các chữ cái Tiếng Việt.
Trang 1LU N VĂN T T NGHI P CHUYÊN NGÀNH Ậ Ố Ệ
KHOA H C MÁY TÍNH Ọ
Đ tài: “Tìm hi u ề ể m ng Neural Hamming và ng d ng trong bài toán ạ ứ ụ
nh n d ng các ch cái Ti ng Vi t” ậ ạ ữ ế ệ
Sinh viên: Phùng Văn Ki mệ
L p ớ : Cao h c k10bọ
Giáo viên h ướ ng d n ẫ : TS Lê Quang Minh
Trang 2PH N M Đ U Ầ Ở Ầ
T lâu các nhà khoa h c đã nh n th y nh ng u đi m c a b ócừ ọ ậ ấ ữ ư ể ủ ộ con người và tìm cách b t chắ ước đ th c hi n trên nh ng máy tính, t oể ự ệ ữ ạ cho nó có kh năng h c t p, nh n d ng và phân lo i Vì v y các nhà khoaả ọ ậ ậ ạ ạ ậ
h c đã nghiên c u và sáng t o ra m ng Neural nhân t o Nó th c s đọ ứ ạ ạ ạ ự ự ượ c chú ý và nhanh chóng tr thành m t hở ộ ướng nghiên c u đ y tri n v ng đ cứ ầ ể ọ ặ
bi t là lĩnh v c nh n d ng Và bài toán nh n d ng ký t là m t bài toánệ ự ậ ạ ậ ạ ự ộ con trong l p các bài toán nh n d ng, x lý nh.ớ ậ ạ ử ả
Hi n nay trên th gi i, các s n ph m nh n d ng ký t đã đệ ế ớ ả ẩ ậ ạ ự ượ c tri n khai tể ương đ i r ng rãi Tuy nhiên đây là các s n ph m nh n d ngố ộ ả ẩ ậ ạ
ký t ti ng Anh, do đó đ i v i nh n d ng ký t ti ng Vi t thì ch cóự ế ố ớ ậ ạ ự ế ệ ỉ
người Vi t Nam m i có th phát tri n đệ ớ ể ể ượ Ở ước n c ta trong m t vài nămộ
g n đây cũng đã có m t s s n ph m nh n d ng ti ng vi t đầ ộ ố ả ẩ ậ ạ ế ệ ược tri nể khai trên th trị ường Nh ng các s n ph m này đư ả ẩ ược bán trên th trị ườ ng
dướ ại d ng đóng kín nên vi c đ phát tri n thành ph n m m t đ ng c pệ ể ể ầ ề ự ộ ậ
nh t nh là đi u không th Vì v y nên tôi đã ch n đ tài ậ ả ề ể ậ ọ ề “Tìm hi u ể
m ng Neural Hamming và ng d ng trong bài toán nh n d ng các ch ạ ứ ụ ậ ạ ữ cái Ti ng Vi t” ế ệ
H th ng ch cái Ti ng Vi t là đệ ố ữ ế ệ ược xây d ng d a trên ch cáiự ự ữ Latinh có thêm ch ghép và d u ph Do đó vi c nh n d ng s g p khóữ ấ ụ ệ ậ ạ ẽ ặ khăn h n so v i ch cái Latinh thông thơ ớ ữ ường và c n ph i có thu t toán xầ ả ậ ử
lý đem l i đ chính xác cao ạ ộ
Trong khuôn kh , th i lổ ờ ượng c a lu n văn, tôi đ a ra m t chủ ậ ư ộ ươ ng trình mô ph ng m ng Neural nh n d ng 29 ch cái Ti ng Vi t t A đ nỏ ạ ậ ạ ữ ế ệ ừ ế
Y và 10 ch s t 0 đ n 9.ữ ố ừ ế
Lu n văn đậ ượ ắc s p x p và chia thành 3 chế ương chính:.
Trang 3- Chương 1: T ng quan v hi n tr ng các bài toán nh n d ng và thi tổ ề ệ ạ ậ ạ ế
l p bài toán nghiên c u;ậ ứ
- Chương 2: Tìm hi u v m ng Neural và kho ng cách Hamming;ể ề ạ ả
- Chương 3: ng d ng m ng neural Hamming trong bài toán nh n d ngỨ ụ ạ ậ ạ các ch cái Ti ng Vi t.ữ ế ệ
Nhân đây, tôi xin chân thành c m n TS Lê Quang Minh ngả ơ ườ ựi tr c ti pế
hướng d n, ch b o nhi t tình cho tôi hoàn thành lu n văn này Tôi xinẫ ỉ ả ệ ậ chân thành cám n các th y cô trong Trơ ầ ường Đ i h c CNTT & TT Đ iạ ọ ạ
h c Thái Nguyên và toàn th các b n đã giúp đ tôi hoàn thành cu n lu nọ ể ạ ỡ ố ậ văn này
Trang 4CH ƯƠ NG I: T NG QUAN V HI N TR NG CÁC BÀI TOÁN Ổ Ề Ệ Ạ
NH N D NG VÀ THI T L P BÀI TOÁN NGHIÊN C U Ậ Ạ Ế Ậ Ứ
1.1 T ng quan v bài toán nh n d ng ổ ề ậ ạ
Nh n d ng ch là m t lĩnh v c đã đậ ạ ữ ộ ự ược quan tâm nghiên c u vàứ
ng d ng t nhi u năm nay theo hai h ng chính:
• Nh n d ng ch in: ph c v cho công vi c t đ ng hóa đ c tài li u, ậ ạ ữ ụ ụ ệ ự ộ ọ ệ tăng t c đ và hi u qu nh p thông tin vào máy tính tr c ti p t các ố ộ ệ ả ậ ự ế ừ ngu n tài li u ồ ệ
• Nh n d ng ch vi t tay: v i nh ng m c đ ràng bu c khác nhau v ậ ạ ữ ế ớ ữ ứ ộ ộ ề cách vi t ,ki u ch ph c v cho các ng d ng đ c và x lý ch ng t , ế ể ữ ụ ụ ứ ụ ọ ử ứ ừ hóa đ n, phi u ghi, b n th o vi t tay Nh n d ng ch vi t tay đ ơ ế ả ả ế ậ ạ ữ ế ượ c tách thành hai h ướ ng phát tri n: nh n d ng ch vi t tay tr c tuy n (on-line) ể ậ ạ ữ ế ự ế
và nh n d ng ch vi t tay ngo i tuy n (off-line) ậ ạ ữ ế ạ ế
Đ n th i đi m này, bài toán nh n d ng ch in đã đế ờ ể ậ ạ ữ ược gi i quy tả ế
g n nh tr n v n (s n ph m FineReader 11 c a hãng ABBYY có thầ ư ọ ẹ ả ẩ ủ ể
nh n d ng ch in theo 20 ngôn ng khác nhau trong đó có c Vi t Nam,ậ ạ ữ ữ ả ệ
ph n m m nh n d ng ch Vi t in VnDOCR 4.0 c a Vi n Công nghầ ề ậ ạ ữ ệ ủ ệ ệ Thông tin Hà N i có th nh n d ng độ ể ậ ạ ược các tài li u ch a hình nh, b ngệ ứ ả ả
và văn b n ti ng Vi t v i đ chính xác trên 99%, ) Tuy nhiên trên thả ế ệ ớ ộ ế
gi i cũng ớ như Vi t Nam, bài toán nh n d ng ch vi t tay v n còn làở ệ ậ ạ ữ ế ẫ
v n đ thách th c l n đ i v i các nhà nghiên c u Bài toàn này ch a thấ ề ứ ớ ố ớ ứ ư ể
gi i quy t tr n v n vì nó ph thu c quá nhi u vào ngả ế ọ ẹ ụ ộ ề ười vi t và s bi nế ự ế
đ i quá đa d ng trong cách vi t và tr ng thái tinh th n c a t ng ngổ ạ ế ạ ầ ủ ừ ườ i
vi t Đ c bi t đ i v i vi c nghiên c u nh n d ng ch vi t tay ti ng Vi tế ặ ệ ố ớ ệ ứ ậ ạ ữ ế ế ệ
Trang 5l i càng g p nhi u ạ ặ ề khó khăn h n do b ký t ti ng Vi t có thêm ph nơ ộ ự ế ệ ầ
d u, r t d nh m l n v i các nhi u.ấ ấ ễ ầ ẫ ớ ễ
1.2 C th v bài toán nh n d ng ch cái Ti ng Vi t ụ ể ề ậ ạ ữ ế ệ
Hi n nay cũng có r t nhi u bài báo đ c p đ n bài toán nh n d ngệ ấ ề ề ậ ế ậ ạ
kí t quang h c, nh m c i ti n các phự ọ ằ ả ế ương pháp phân đo n nh, nh nạ ả ậ
d ng Song v n ch a gi i quy t m t cách tri t đ nh ng v n đ khó khănạ ẫ ư ả ế ộ ệ ể ữ ấ ề
c a bài toán thủ ường g p ph i Đ c bi t là đ i v i vi c nh n d ng các kíặ ả ặ ệ ố ớ ệ ậ ạ
t ti ng Vi t, g p r t nhi u khó khăn, do tính riêng bi t c a ti ng Vi t:ự ế ệ ặ ấ ề ệ ủ ế ệ
S kí t nhi u, các kí t l i có d u…Nên bài toán v n còn thu hút đố ự ề ự ạ ấ ẫ ượ c
s quan tâm, nghiên c u nh m gi i quy t nh ng v n đ khó khăn c a bàiự ứ ằ ả ế ữ ấ ề ủ toán m t cách tri t đ M t s h nh n nh n d ng văn b n đã và đangộ ệ ể ộ ố ệ ậ ậ ạ ả
được áp d ng r t nhi u vào ng d ng nh FineReader c a hãngụ ấ ề ứ ụ ư ủ AABBYY, OmmiPage c a hãng Scansoft đủ ược dùng đ nh n d ng cácể ậ ạ văn b n ti ng Anh,… VNDOCR c a Vi n công ngh thông tin cho cácả ế ủ ệ ệ văn b n ti ng Vi tả ế ệ
Nhìn chung, các s n ph m ph n m m nh n d ng văn b n Ti ngả ẩ ầ ề ậ ạ ả ế
Vi t ch in c a nệ ữ ủ ước ta đã thu được k t qu kh quan, đ c bi t ph nế ả ả ặ ệ ầ
m m VNDOCR đã đề ược s d ng r ng rãi trong các c quan nhà nử ụ ộ ơ ướ c Riêng ph n nh n d ng kí t vi t tay v n đang đầ ậ ạ ự ế ẫ ược nghiên c u và phátứ tri n nh m ph c v cho các yêu c u khác nhau nh đ c và x lý các bi uể ằ ụ ụ ầ ư ọ ử ể
m u: hóa đ n, phi u đi u tra ẫ ơ ế ề
Khó khăn l n nh t khi nghiên c u bài toán nh n d ng ch cái ớ ấ ứ ậ ạ ữ
ti ng Vi t là s bi n thiên quá đa d ng trong cách vi t c a t ng ế ệ ự ế ạ ế ủ ừ
Trang 6ng ườ i Cùng m t ng ộ ườ i vi t nh ng đôi khi cũng có nhi u s khác ế ư ề ự
bi t trong cách vi t tuỳ thu c vào t ng ng c nh, ki u vi t c a m t ệ ế ộ ừ ữ ả ể ế ủ ộ
ng ườ i cũng có th thay đ i theo th i gian ho c theo thói quen Đi u ể ổ ờ ặ ề này gây ra nhi u tr ng i trong vi c nh n d ng cũng nh l a ch n ề ở ạ ệ ậ ạ ư ự ọ
mô hình nh n d ng ậ ạ
1.3 Thi t l p bài toán ế ậ
Đ tài mà tôi th c hi n là: “ ng d ng m ng Neural Hamming trong bàiề ự ệ Ứ ụ ạ toán nh n d ng các ch cái Ti ng Vi t”, công vi c chính là “Xây d ngậ ạ ữ ế ệ ệ ự
chương trình nh n d ng các ch cái Ti ng Vi t” ý tậ ạ ữ ế ệ ưởng bài toán như sau:
Phân tích nh cho ký t : Chia nh và tách ký t theo t ng vùng gi iả ự ả ự ừ ớ
h n;ạ
Chuy n đ i kí t sang ma tr n đi m nh;ể ổ ự ậ ể ả
Chuy n thành ma tr n tuy n tính và đ a vào m ng neural;ể ậ ế ư ạ
Đ a vào m ng neural tính giá tr đ u ra.ư ạ ị ầ Các bước gi i quy t bài toán s d ng m ng neural Hamming nh nả ế ử ụ ạ ậ
d ng ch cái Ti ng Vi t mô t theo ti n trình chung nh sau:ạ ữ ế ệ ả ế ư
nh đ u vào
bi n đ i nh ế ổ ả Nh n d ng ậ ạ K t qu ế ả
Hình 1 S đ h th ng nh n d ngơ ồ ệ ố ậ ạ
1.3.1 nh đ u vào Ả ầ
V i đ u vào là các file nh *ớ ầ ả .bmp có kích c nh là 150 x 150 Sauỡ ả khi đã n p m u c n nh n d ng ta ti n nh các thao tác x lý nh đ táchạ ẫ ầ ậ ạ ế ả ử ả ể
ra ký t Ta có th xác đ nh đự ể ị ược ký t d a vào đự ự ường biên c a ký t ủ ự
Tr i qua các bả ươc ti n x lý nh: l c m n nh, nh phân, ch nh nghiêng,ề ử ả ọ ị ả ị ỉ
Trang 7chu n kích thẩ ước, l p kho ng tr ng, l y biên, ta thu đấ ả ố ấ ượ ảc nh ký t v iự ớ biên c a nó.ủ
1.3.2 Ti n s lý ề ử
Giai đo n này góp ph n làm tăng đ chính xác phân l p c a hạ ầ ộ ớ ủ ệ
th ng nh n d ng, tuy nhiên nó cũng làm cho t c đ nh n d ng c a hố ậ ạ ố ộ ậ ạ ủ ệ
th ng ch m l i Vì v y, tùy thu c vào ch t lố ậ ạ ậ ộ ấ ượng nh quét vào c a t ngả ủ ừ văn b n c th đ ch n m t ho c m t vài ch c năng trong kh i này N uả ụ ể ể ọ ộ ặ ộ ứ ố ế
c n u tiên t c đ x lý và ch t lầ ư ố ộ ử ấ ượng c a máy quét t t thì có th b quaủ ố ể ỏ giai đo n này Kh i ti n x lý bao g m m t s ch c năng:ạ ố ề ử ồ ộ ố ứ
Nh phân hóa nh, l c nhi u, chu n hóa kích thị ả ọ ễ ẩ ướ ảc nh, làm tr nơ biên ch , làm đ y ch , làm m nh ch và xoay văn b n.ữ ầ ữ ả ữ ả
1.3.2.1 Nh phân hóa nh ị ả
Nh phân hóa nh là m t k thu t chuy n nh đa c p xám ị ả ộ ỹ ậ ể ả ấ sang nh nh phân Trong b t kỳ bài toán phân tích ho c nâng cao ả ị ấ ặ
ch t l ấ ượ ng nh nào, nó cũng c n thi t đ xác đ nh các đ i t ả ầ ế ể ị ố ượ ng quan tr ng Nh phân hóa nh phân chia nh thành 2 ph n: ph n ọ ị ả ả ầ ầ
n n và ph n ch H u h t các ph ề ầ ữ ầ ế ươ ng pháp nh phân hóa nh ị ả
hi n nay đ u l a ch n m t ng ệ ề ự ọ ộ ưỡ ng thích h p theo c ợ ườ ng đ sáng ộ
c a nh và sau đó chuy n t t c các giá tr đ sáng l n h n ủ ả ể ấ ả ị ộ ớ ơ
ng ưỡ ng đó thành m t giá tr đ sáng (ví d “tr ng”) và t t c các ộ ị ộ ụ ắ ấ ả giá tr bé h n ng ị ơ ưỡ ng thành m t giá tr đ sáng khác (“đen”) ộ ị ộ
Trang 8Hình 1.2 Nh phân hóa nh ị ả
1.3.2.2 L c nhi u ọ ễ
Nhi u là m t t p các đi m sáng th a trên nh Kh nhi u là m tễ ộ ậ ể ừ ả ử ễ ộ
v n đ thấ ề ường g p trong nh n d ng, nhi u có nhi u lo i (nhi u đ m,ặ ậ ạ ễ ề ạ ễ ố nhi u v t, nhi u đ t nét ) Đ kh các nhi u đ m (các nhi u v i kíchễ ệ ễ ứ ể ử ễ ố ễ ớ
thước nh ), có th s d ng các phỏ ể ử ụ ương pháp l c (l c trung bình, l c trungọ ọ ọ
v )- Tuy nhiên, v i các nhi u v t (ho c các nhi u có kích thị ớ ễ ệ ặ ễ ướ ớc l n) thì các phương pháp l c t ra kém hi u qu , trong trọ ỏ ệ ả ường h p này s d ngọ ử ự
phương pháp kh các vùng liên thông nh t ra có hi u qu h n.ử ỏ ỏ ệ ả ơ
Hình 1.3 Nhi u đ m và nhi u v t ễ ố ễ ệ
1.3.2.3 Chu n hóa kích th ẩ ướ ả c nh
Hình 1.4.Chu n hóa kích th ẩ ướ ả c nh các ký t “A” và “P” ự
Trang 9Vi c chu n hóa kích thệ ẩ ướ ảc nh d a trên vi c xác đ nh tr ng tâmự ệ ị ọ
nh, sau đó xác đ nh kho ng cách l n nh t t tâm nh đ n các c nh
trên, dưới, trái, ph i c a hình ch nh t bao quanh nh Thông quaả ủ ữ ậ ả kho ng cách l n nh t đó, có th xác đ nh đả ớ ấ ể ị ược m t t l co, giãn c aộ ỷ ệ ủ
nh g c so v i kích th c đã xác đ nh, t đó hi u ch nh kích th c nh
theo t l co, giãn này Nh v y, thu t toán chu n hóa kích thỷ ệ ư ậ ậ ẩ ướ ả c nh luôn luôn đ m b o đả ả ược tính cân b ng khi co giãn nh, nh s không bằ ả ả ẽ ị
bi n d ng ho c b l ch.ế ạ ặ ị ệ
1.3.2.4 Làm tr n biên ch ơ ữ
Đôi khi do ch t lấ ượng quét nh quá x u, các đả ấ ường biên c a chủ ữ không còn gi đữ ược dáng đi u tr n tru ban đ u mà hình thành cácệ ơ ầ
đường răng c a gi t o Trong các trư ả ạ ường h p này, ph i dùng các thu tọ ả ậ toán làm tr n biên đ kh c ph c [28].ơ ể ắ ụ
(a) (b)
Hình 1.5.(a) nh g c, (b) nh sau khi đ Ả ố Ả ượ c làm tr n biên ơ
1.3.2.5 Làm đ y ch ầ ữ
Ch c năng này đứ ược áp d ng v i các ký t b đ t nét m t cáchụ ớ ự ị ứ ộ
ng u nhiên nh đ t nét gây khó khăn cho vi c tách ch , d b nh m haiẫ Ả ứ ệ ữ ễ ị ầ
ph n liên thông c a ký t thành hai ký t riêng bi t, t o nên sai l mầ ủ ự ự ệ ạ ầ trong quá trình nh n d ng.ậ ạ
Trang 101.3.2.6 Làm m nh ch ả ữ
Đây là m t bộ ước quan tr ng nh m phát hi n khung xọ ằ ệ ương c a kýủ
t b ng cách lo i b d n các đi m biên ngoài c a các nét Tuy nhiên,ự ằ ạ ỏ ầ ể ủ quá trình làm m nh ch r t nh y c m v i vi c ả ữ ấ ạ ả ớ ệ kh nhi u Hi n nay cóử ễ ệ nhi u phề ương pháp làm m nh ch , các thu t toán tìm xả ữ ậ ương có thể tham kh o [28].ả ở
Hình 1.4 Làm m nh chả ữ
1.3.2.7 Đi u ch nh đ nghiêng c a văn b n ề ỉ ộ ủ ả
Do trang tài li u quét vào không c n th n ho c do s c in n, cácệ ẩ ậ ặ ự ố ấ hàng ch b l ch so v i l chu n m t góc α, đi u này gây khó khăn choữ ị ệ ớ ề ẩ ộ ề công đo n tách ch , đôi khi không th tách đạ ữ ể ược Trong nh ng trữ ườ ng
h p nh v y, ph i tính l i t a đ đi m nh c a các ch b sai l ch Cóợ ư ậ ả ạ ọ ộ ể ả ủ ữ ị ệ nhi u k thu t đ đi u ch nh đ nghiêng, k thu t ph bi n nh t d aề ỹ ậ ể ề ỉ ộ ỹ ậ ổ ế ấ ự trên c s bi u đ chi u (projection profile) c a nh tài li u; m t s kơ ở ể ồ ế ủ ả ệ ộ ố ỹ thu t d a trên c s các phép bi n đ i Hough và Fourier, m t s kậ ự ơ ở ế ổ ộ ố ỹ thu t hi u ch nh đ nghiêng khác có th tìm th y trong [28].ậ ệ ỉ ộ ể ấ
Trang 11Hình 1.7.Hi u ch nh đ nghiêng c a văn b n ệ ỉ ộ ủ ả
Trang 12Quá trình bi n đ i nh ế ổ ả
M t s phộ ố ương pháp bi n đ i và khai tri n chu i thế ổ ể ỗ ường được áp
d ng trong ụ lĩnh v c nh n d ng ch :ự ậ ạ ữ
1.3.3.1 Bi n đ i Fourier ế ổ
M t trong nh ng tính ch t n i b t nh t c a phép bi n đ i Fourierộ ữ ấ ổ ậ ấ ủ ế ổ
là kh năng nh n d ng các ký t có s thay đ i v các t th khácả ậ ạ ự ự ổ ề ư ế nhau, các phép bi n đ i này đã đế ổ ược áp d ng đ nh n d ng ký t theoụ ể ậ ạ ự nhi u cách khác nhau [29,30].ề
1.3.3.2 Bi n đ i ế ổ Wavelet
Phép bi n đ i này là m t dãy các k thu t khai tri n cho phép môế ổ ộ ỹ ậ ể
t đ c tr ng c a nh các m c đ khác nhau Các công đo n tách chả ặ ư ủ ả ở ứ ộ ạ ữ thành các ký t ho c t đự ặ ừ ược mô t b ng các h so wavelet theo cácả ằ ệ
m c đ khác nhau đ i v i t ng gi i pháp Sau đó các h so waveletứ ộ ố ớ ừ ả ệ
được chuy n qua m t máy phân l p đ ph c v cho vi c nh n d ngể ộ ớ ể ụ ụ ệ ậ ạ [31,32]
1.3.3.3 Ph ươ ng pháp mô men
Theo phương pháp này, nh g c s đả ố ẽ ược thay th b ng m t t pế ằ ộ ậ các đ c tr ng v a đ c a đ nh n d ng các đ i tặ ư ừ ủ ủ ể ậ ạ ố ượng b t bi n đ i v iấ ế ố ớ các phép thay đ i t l , t nh ti n ho c quay [33] Các mô men đổ ỷ ệ ị ế ặ ược xét
nh các dãy khai tri n đ c tr ng vì nh g c có th xây d ng l i m tư ể ặ ư ả ố ể ự ạ ộ cách đ y đ t các h s mô men.ầ ủ ừ ệ ố
1.3.3.4 Khai tri n Karhunent-Loeve ể
Trang 13Vi c khai tri n này nh m phân tích các véc t riêng đ rút g n sệ ể ằ ơ ể ọ ố chi u c a t p đ c tr ng b ng cách t o ra các đ c tr ng m i là t h pề ủ ậ ặ ư ằ ạ ặ ư ớ ổ ợ tuy n tính c a các đ c tr ng g c Đây ch là m t phép bi n đ i t i uế ủ ặ ư ố ỉ ộ ế ổ ố ư trong m t s gi i h n nào đó c a vi c nén thông tin [34], Khai tri nộ ố ớ ạ ủ ệ ể Karhunent-Loeve được dùng trong m t s bài toán nh n d ng m u nhộ ố ậ ạ ẫ ư
nh n d ng m t ngậ ạ ặ ười, nó cũng đượ ử ục s d ng trong h th ng OCR c aệ ố ủ
Vi n Công ngh và Tiêu chu n Qu c gia Hoa Kỳ (NIST - Nationalệ ệ ẩ ố Institute of Standards and Technology of the United States) Vì vi c khaiệ tri n này đòi h i ph i s d ng các thu t toán có kh i lể ỏ ả ử ụ ậ ố ượng tính toán
r t l n nên vi c s d ng các đ c tr ng Karhunent-Loeve trong các bàiấ ớ ệ ử ự ặ ư toán nh n d ng ch không đậ ạ ữ ược ph bi n r ng rãi Tuy nhiên, đ tăngổ ế ộ ể
t c đ tính toán cho các máy phân l p, các đ c tr ng này tr nên thi tố ộ ớ ặ ư ở ế
th c h n cho các h nh n d ng ch trong nh ng năm g n đây.ự ơ ệ ậ ạ ữ ữ ầ
1.3.4 Nh n d ng ậ ạ
Có nhi u phề ương pháp nh n d ng m u khác nhau đậ ạ ẫ ược áp d ngụ
r ng rãi trong các h th ng nh n d ng ch vi t tay Các phộ ệ ố ậ ạ ữ ế ương pháp này có th để ược tích h p trong các hợ ướng ti p c n sau: Đ i sánh m u,ế ậ ố ẫ
th ng kê, c u trúc, SVM và m ng n ron.ố ấ ạ ơ
1.3.4.1 Đ i sánh m u ố ẫ
K thu t nh n d ng ch đ n gi n nh t d a trên c s đ i sánhỹ ậ ậ ạ ữ ơ ả ấ ự ơ ở ố các nguyên m u (prototype) v i nhau đ nh n d ng ký t ho c t Nóiẫ ớ ể ậ ạ ự ặ ừ chung, toán t đ i sánh xác đ nh m c đ gi ng nhau gi a hai vé tử ố ị ứ ộ ố ữ ơ (nhóm các đi m, hình d ng, đ cong ) trong m t không gian đ c tr ng.ể ạ ộ ộ ặ ư Các k thu t đ i sánh có th nghiên c u theo ba hỹ ậ ố ể ứ ướng sau: