Nhận đạng và pán nhãn cho hình ảnh đóng vai trỏ quan trong trong nhiền ứng dụng thực tế về khoa học 17 đuật cũng như trong, cuộc ông thưởng ngày như: săn xuất và kiểm tra chất lượng, sự
Trang 1PUAN MO DAU
Cimg voi sy phat triển ngày cảng auanh mẽ của khoa học kí thuật trong một vài thập kỷ gần dây, xử lý ảnh tuy là một ngành khoa hoc củn tương đôi indi mẻ øo với nhiền ngành khoa học khác nhưng, tiện nay nó dang là một trong những lình vực phhát triển rất nhanh và thu hút sự quan tâm đặc biệt từ các nhà khoa học, thúc đẩy các trang, tâm nghiên cửu, ứng dụng về lính vực hấp dẫn này
Nhận đạng và pán nhãn cho hình ảnh đóng vai trỏ quan trong trong nhiền ứng dụng thực tế về khoa học 17 đuật cũng như trong,
cuộc ông thưởng ngày như: săn xuất và kiểm tra chất lượng, sự di
chuyên cửa Rơbol, tác phương tiện đĩ lại tự trị, công cụ hướng dẫn
eho tigtời ml, an ninh và giám sát, nhận dang đối tượng, nhận dạng
mil, vac img dung trong y học, sản xuất, hiệu chính video,
Một trong những ứng đụng quan trọng, là việc nhận đạng và gắn nhăn cho các loại hình ảnh Tự động nhận dạng ảnh và đặt vị trí nhãn là một li: vực trong trực quan hóa thông từn Nhãn là các đoạn văn bản nhằm truyén dal thong tin, làm rõ ý nghĩa của các tấn trúc phức tạp được biểu điễn ở dạng đỗ họa
Bai toan nhan dang và gan nhãn đã được đề cập, nghiên cửu
nhiều trên thể giới Tại Việt Nam bài toán này cũng đang rất được chủ trọng và được ứng dụng trong rất nhiễu lĩnh vực Vì vậy, đề tài này được xây dựng với các mục đích: 'Lần hiểu về bài loàn nhận dạng, Tỉnh ảnh và gản nhấn, ứme đựng, của nó trong các Tĩnh vực, Tìm hiển
một số vẫn để, các thuật toán liên quan; Đặi nền lắng cho cả nhân nghiên cứu, tim hiển sâu hơn về vẫn để này Từ đỏ thiết kế một
chương trình thử nghiệm nhận dạng và gán nhãn cho một ảnh cụ thế
Luận văn gồm phẩn mở dẫu, phẫu kết luận và 3 chương, nội
dung che chong, nh sau:
Chương, 1: Khái quải về gắn nhãn và bài toán nhận dạng,
dối tượng
Trang 2
Chwong nay khai quát lại cơ bản những kiên thức
cán nhãn gằm xứ lý ánh vá gân nhãn trong, xử lý anh Dang thoi néi
về bài tuãn nhận dạng đối lượng, vai lrỏ và lẫm quan lrọng cửa bài toán nhận dang đối tượng, các phương pháp nhận đạng đổi tượng,
cũng như mội số hệ thông nhận dạng đổi lượng nổi tiếng trên thế giới
Chương 2: Một số vẫn để trong nhận đạng đối tượng sử
dụng mạng naran
Chương 2 để cập đến một số vẫn đề trong nhận đạng đổi tượng,
sử dụng mạng noron Mớ tả kiễn trúc của một hệ thông nhận dạng đối tượng sử đụng mang nơron nhân tạo và cách thiết kế, huấn luyện Trạng nơrơn nhân tạo cho việc nhận dạng,
Chương 3: Chương trình thữ nghiệm
Chương nay äp đụng các kiên thức nghiên cún trong chương 1
và chương 2, sử dụng ruạng nơron nhiều lớ lan truyền ngược và kỹ thuật pán nhân dễ xây đựng một chương trình nhận dang ky tụ
Trang 3
CHUONG 1: KUAI QUAT VE GAN NILAN VA BAI TOAN NHẬN DẠNG ĐÓI TƯỢNG
Chương mày khái qướt lại cư băn những kiên thức
gan nln gam sat ly anh vá sán nhãn trong xử lý ảnh Dẳng thời nói
về bài tuán nhận dạng đối lượng, vai trò và lẫm quan lrọng cửa bài
toán nhận đạng đối tượng, các phương pháp nhận đạng đối trọng,
cũng như mội số hệ thông nhận dạng đối tượng nổi tiếng trên thể
Xử lý ảnh là một phẩn của lĩnh vực xử lý tin hiện số Tăng,
cường, chất hrợng thông tin hinh ảnh đối với quả trình trí giác của cơn
người và biển điễn trên máy tỉnh Xử lý ảnh số bao gồm các phương,
pháp vả kỹ thnật để biển đổi, để trnyên Lãi hoặc mã hóa các ảnh tự
nhiên
Xử lý ảnh liên quan đến việc thay đổi hình ảnh để đạt được mời trong hai mục dich:
- Thứ nhất: biến đổi ảnh và làm đẹp ảnh
- Thứ bai: lự động phân tích nhận dạng ảnh hay đoán nhận ảnh
và đánh gid các nội dung cña ảnh
1 do phải xử Tý ảnh:
~ Ảnh có thể bị lỗi trong quả trình thu ảnh, truyền đẫn và hiển thi (hỗi phục, năng cao chất hượng ảnh, nội sny)
~ Ảnh có thể mang các nội dung nhạy cảm (vẻ, chống lại copy
*hông hợp pháp, etd mao va lita dao)
- Tạo các bức ảnh có hiệu ứng nghệ thuật
Có thể tạm phân biệt các hệ thông xử lý ảnh theo mức độ phức tap của thuật Loán xử lý như sau:
- Xử lý ảnh mức thấp: đó là các quá trình biển đổi đơn giân như thực hiện các bộ lọc nhằm khử nhiễu trong ảnh, lăng cường độ
Trang 4tương phản hay độ né: của ảnh Trong trường hợp này, tín hiệu đưa
vào hệ thống xử lý và tin hiệu ở đâu +a là ảnh quang học
- Xử lý ảnh mức trưng: quá trình xử lý phức Lạp hơn, (hường được wit dung, dé phan lớp, phân doan ảnh xác định và đự đöan biên
ảnh, nén anh để lưu trữ hoặc truyền phái Đặc điểm của các hệ thống
xế lý ảnh nức trung là tín hiện đầu vào là hình ảnh, còn tin hiệu đân
Ta là các thành phân được tách ra từ hình ảnh gốc, hoặc luồng đữ liện nhận được sau khi nén ảnh
- Xử lý ảnh mnức cao: là quá trinh phân tích và nhận dạng hình ảnh Đây cũng là quá trình xử lý được tực hiện trong hệ thông thì giác cửa con người
Củng ta có thé thấy răng, không phải bắt kỳ một ứng đụng xử 1ỷ ảnh nào cũng, bắt buộc phãi tuân theo các bước xử lý đã nêu ở trên,
ví dụ như uác ứng dụng chỉnh sửa ảnh nghệ [huật chỉ dừng lại ở bước tiên xử lý Một cách tổng quát thủ những chức năng xử lý bao sắm cả nhận dạng và giải thích thường chỉ có mật trong hệ thông phản tích ảnh tự động hoặc bản tự động, được dùng để rút trích ra những thông, tin quan trạng từ ảnh, vi dụ như các ứng dụng nhận dạng kí tự quang hoc, nhận dạng chữ viết tay wv
1.1.2 Gần nhãn trong xữ lý ảnh
Nhấn là các đoạn văn bân nhằm truyền đạt thông tin, lam 16
ngiấa của các câu trủc phức tạp được biển điển ở dang, dé hoa Bai
toán tự đông gắn nhấn được xác định là một lính vực nghiên cứu quan trợng của ACM Compttational Geometry Task Eorce (Dội tính toán hình học ACM)
Gián nhấn là nguồn của nhiên bài toán tôi un héa hinh hoc Ngay cả khi nhãn được đặt vào vị trí cô định tương ứng với một điểm, đây vẫn là bài toản NP-harđ Các bản đổ cản được gán nhãn,
vậy cần cá các piãi thuật hiệu quả giải thuật henristies để xác định những ràng buộc, vị trí có thể
Trang 5
Giản nhãn cho đổi tượng là xác định nhãn phân loại cho từng thành phân trong đổi tượng quan sát được Gán nhãn cho đổi tượng, được sử dụng nhiều lrơng các bài loam gán nhãn Lừ loại, nhận dạng
nh ánh, âm thanh hay các bải toàn vẻ dự đoán gen
Day 1a bai toán có ứng dụng trong nhiều nh vực bao gồm vẽ 'ˆân đổ, hệ thống thông tín địa lý và vẽ đô thị Hiện trên thế giới đã có nhiều công trình nghiên cửu vẻ bài toán gán nhãn tự động Tuy nhiên
ở Việt Nam, bài toán này còn được để cập đến một cách hạn chế
‘Trong bai toán gán nhãn cho đổi tượng thành công, nhãn phải được đặt sao cho người xem đề đọc và theo tiêu chuẩn chất lượng, thấm mỹ cơ bản Nhẫn phải được đặt ở vi tr tốt nhất cô sẵn theo một
số quy tắc cơ bản: Nhãn phải được đễ đàng đọc, nhanh chóng xác định vị trí một nhãn và đổi tượng má nó thuộc vê thì nền được để đảng thừa nhữm, nhăn phải được đặt rất gần với các đổi lượng của chứng, nhần không được cha khuất các nhãn khác hoặc các đổi tượng,
*khác, một nhãn phải được đặt ở vị trí thích hợp nhất trong, số tất cả các vị trí đễ đọc Tóm tắt các đánh giá chất lượng gán nhãn trong ba quy tắc co ban sau đây:
- Không có sự chẳng chéo của một nhãn với các nhãn khác,
các đối tượng đỗ họa khác của bản vẽ
- Mỗi nhãn có thể đễ đàng được xác định là của đối tượng nao trong hình vẽ,
- Mỗi nhãn phải được đặt ở ví trí tốt nhất có thể (trong số tắt
cả các nhăn cỏ vị trí chấp nhận được) Thử tự hiển thị wu tiên giữa các vị trí nhân có thể thay đối tủy theo ứng dụng cụ thể
1.2 Bài toán nhận dạng đối tượng
1.2.1 Giới thiệu
Nhu chúng ta biết, sự xuất hiện hình ânh của một bể mặt pin thuộc vào nhiều yến (ỗ: Ánh sáng, các tháng số máy ảnh và định vị
máy ảnh Trong rất nhiễu Tính vực như điều khiển, tự động hóa, công,
nghệ thông tin , nhận đạng được đối tượng la vấn để mẫu chất
Trang 6
quyết định sự thành công của bai toán Nhận dạng là bước đầu tiên và
quan trọng nhất của nhiều B:ih vực khoa học, đặc biệt trong lĩnh vực
điều khiến và lự động hóa nêu không nhận dạng chúnh xác đối lượng
điều khiển thi sẽ không cỏ giải pháp tôi tru nhất để điển khiển chúng,
'Tử việc mội đối Lượng phải được nhận dạng Lừ sự xuất hiện của nhiêu vật thể, sự phức tạp của nhận đạng đối tượng phụ thuộc vào nhiều yếu tÔ Nhận dạng là quá trình phân loại các đổi trợng được biển điển theo một mô hình nào đó và gán chúng một tên (gán cho đối tượng một tên gọi, tức là một dang) dyva theo những quy luật và mẫu
chuẩn
1.2.2 Các cách tiếp cận
1.2.2.1, Nhận dạng đôi tượng dùng thống kê
Khái niêm: Nhân đạng đối tương đừng thông kế là một phương pháp nhận dạng đối tượng dựa vào các đặc tính thống kê các đối tượng Nhận đạng đối trợng dùng thống kê sử dụng các phương pháp máy học dựa trên thống kê để học và rút ra đối tượng, tham khảo tử một lượng đữ liệu lớn
1.2.3.2 Nhận dạng dựa then cần trúc
Biểu điển định tinh,
Trơna cách biển điễn này, người ta quan tâm đến các dang va
mỗi quan hệ giữa chủng Giả thiết rằng, mỗi đối tượng được biển
điền bởi một dãy ký tự, các đắc tính biển điễn hởi củng một số ký tị
Phương pháp nhận dạng ở dây là nhận dạng logic, dụs vào hàm phân
"biệt 1à hàm Bool Cách nhận dạng lã nhận đang các từ có củng độ dài 1.1.2.3, Nhận dạng dựu trên mạng nơyun
Giới thiện
XửI trường hợp đối lượng phi tuyến có độ phức Lạp cao, riểu
sử dung phương pháp giải tích thông thường để nhận đạng sẽ rất khó
khăn, thậm chí không thục hiện được do sự hiếu biết nghèo nàn và
đổi tượng, Vì vậy các nhà khoa học đá đưa ra ý trông là sử đụng
công cụ tỉnh toán mêm như hệ mở, mạng noron, đại số gia tử để xắp
lúa
Trang 7
xi -chính là nhận đạng đối tượng, Mạng nơron là một trong những,
công cụ hữu hiệu đế nhận đạng mô hinh đối tượng, bằng, phương,
tháp này ta không biết được mô hình toán thực sự cửa đổi lượng
nhưng hoán toàn có thế sử đựng kết quả xâp xỉ để thay thẻ đối tượng
Cau ine neural nhân tạo
Mô hình ngron nhân tạo gốm 3 phần chính: Bộ tổng liên kết
đâu vào, bộ động, học tuyến tỉnh và bộ phí tuyến
1.2.3 Một số hệ thống nhận đạng đổi tượng hiện nay
1.2.4 Qny trinh hoạt động của một hệ thống nhận dạng dải lugug
Trang 8CIUONG 2: NUAN DANG DOI TƯỢNG
NGRON
Chương 2 dé cập đến một số vân đẻ Irong nhận dạng đổi
tượng sử dụng mạng Noren Mô tả kiến lrúc của một hệ thông nhận dạng đối tượng sử dụng mạng rtoron nhân lạo và cách thiết kế, huấn Tuyện mạng noron nhân tạo cho việc nhận đạng
2.1.1 Khái niệm mạng naron nhân tạa
Mạng nơron nhân tạo hay thường gọi ngắn gon 14 mang
noron, trong tiéng anh 14 Artificial Neural Network Né gm cé mét nhóm các noron nhân tạo nói với nhau, và xử lý thông tin bằng cách
truyền theo các kết nỗi vả lính giá trị mới tại các nút Trong nhiêu
urường hợp, mạng noron nhân lạu là mội hệ thong thích ứng, tự thay đối câu trúc của mình dựa trên các thông tin bên ngoài hay bên trong chây qua mạng trong quá trinh học
2.1.2 Lịch sử phát triển của mạng nơron
2.1.3 Mồ hình ngron
2.1.3.1 Nơrun nhân lụo đơn giản
Một neron nhân tạo đơn giản lã một thiết bi với nhiền đâu
vào và có một đâu ra Nơron có lai chế độ hoạt động: ch
luyện và chế đô sử đụng, Trong chả độ huẫn luyện, noron có thế được huấn luyện với một số các đổi Lượng đầu vào tới khi không được sử đụng sữa Trang chê dộ sử đụng thì khi phát hiện một đôi
tượng đã học tại đầu vào, đầu ra của nó sẽ lrở thành đầu ra hiện tại
'éếu dôi tượng đầu vào không thuộc vào đanh sách dôi tượng đã học
thi luật loại bỏ được sử đựng đẻ tiếp tục đùng hay loại bỏ niơron
2.1.3.2 Nơron phức tạp hơn (Mô bình McCuHoch và Pitts: MCP)
lật với mô hình đơn giản ở trên là dâu vào của mô
Trình này có Irọng số, hiệu quả của nó là muỗi đâu vào có mội sự đưa
Trang 9za quyét dinh plra thudc vao trọng số của từng đâu vào Trọng số của một đẫu vào là một số mà khi nhân với dầu vào thí ta có được trọng
số đân vào Những đầu vào trọng số nảy được nhám Tại với nhan va
nêu chứng vượt quá giá trị ngưỡng thả nơrơn sẽ bị loại bỏ Với các trường hợp khác thì ngron không bị loại bỏ
2.1.4 So sánh mạng noron với máy tinh truyén thống
2.1.5 Mật số kiến trúc mạng noron dùng nhận đạng dối tượng 2.1.5.1 Mạng truyền thẳng
Mạng truyền thẳng cho phép tín hiệu truyễn chí theo một đường từ đân vào tới đầu ra, không có sự phản hồi hay lập lại Mang nay có xu hướng (ruyễn thẳng giữa dâu vào với đầu ra Chúng được
đng rộng rãi trong nhận đạng đối tượng, Cách tả chức trong mang
truyền thống là tham chiếu tới phương pháp tử đưới lên hoặc là từ
trên xuống,
2.1.5.2 Mạng hổi quy
Mạng hải quy có kiễn trúc tương tt mang truyền thắng (hình
2.3) nhưng có điểm khác nhau đó là nó cho phép tín hiệu truyền theo
cả hai hướng Mang hồi quy truyền tín hiệu rảt tết và có thể trở lên rất phức tạp Nó có tính động; trạng (hứi của nó thay đổi liên Lục tới Shi đạt tới điểm trạng thai cin bing Ching đuy tri điểm
cân bảng tới khi đân vào thay đổi và cần tìm một một Irạng thái cân
'°ằng mới Kiễn trúc bồi quy có thể tham chiêu tới
2.1.5.3 Các lớp mạng
Các loại phổ biển nhất của mạng nơron nhân tạo bao gốm ba nhóm hoặc lớp của các đư vị: một lớp của các đưn vị "đầu vào” được kết nỗi với một lúp của các đơn vị "ẩn", và lớp don vi “An” nay được kết nỗi với một lớp cña đơn vị "đầu ra”
Trang 10duge dat ra bi Frank Rosenblatt Perceptron (hinth 2.5) tré thank mét
Tô hình MCP (noron với dau vào trọng sô) với một số bố sưng, sửa
chữa, tiền xử lý Các đơn vị có nhần À1, A2, Aj, Ap được gọi là đơn
vị kết nói vả nhiệm vụ của chúng là trích xuât các đặc điểm riêng biệt
từ những hình ảnh đâu vào
2.1.6 Ứng dụng của mạng nơron nhân tạo
3.2 Thiết kế mạng nornn nhân tạo
»_ Bước 2: Thu thập đứ liệu
© Bude 3: Tiền xử lý dữliệu
» _ Buớc 4: Các tập đữ liệu huấn luyện, kiểm thở, và chứng,
"Hước 7: Triển khai
2.2.1 Chỉ tiết các bước thiết kế một mang noron
2.2.1.1 Lựa chọu biển
Trang 11Tmong muốn được gọi là học hay huản luyện
2.3.2, Hục có giám sái (ron các iạng nơron
Học cớ giảm sát có thế được xem rửa việc x4p xi một ảnh xạ:
X— Y trong đó X là tập các vẫn đề và Y là tập các lời giải tương,
me cho vẫn đê đô Các đổi tượng (x y) với x = (X1, X2 , xn) E XÃ, y
=(l.y2, ym) € Y được cho trước
2.3.3 Thuật Luán lan truyền ngược Hack-Propaeation
Thmat toán lan truyền ngược là dạng tổng quát của thuật toán
trung bình bình phương lối thiểu 'Thuậi loán này thuộc dạng thuật loan sap xi dé tim cae điểm mà tại đó hiệu năng của mạng là tối ưu Chí số tôi ưu thường được xác định bởi một ham số cúa ma trận trong,
số và cáo đâu vào nào đó mã trong qua trình tìm hiển
bài toán đất ra
3.3.3.1 Mô tả thuật toán
Mạng lan trụ
hư ngược là mội hàm phí luyến có Lhể xấp xỉ
sẵn đúng nhất một hàm đích được cho qua một số đối tượng trong,
tập đôi tợng Một mạng lan truyền tống gái 1ä một mạng cd n (n>2) lớp: lớp thứ nhất sợi là lớn nhập, lớp thứ n lã lớp xuÂt và n-2 lớp ấn
Phần lớn các mạng chủ có một biển phụ thuộc nhưng với mỏ hình La
trên mạng nơron cho phép số nút trong lớp nhập, lớp xuất, và lớp ân
12