1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn gán nhãn Đối tượng dựa vào kỹ thuật nhận dạng

22 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Luận văn gán nhãn đối tượng dựa vào kỹ thuật nhận dạng
Trường học Trường Đại Học Công Nghệ Thông Tin
Chuyên ngành Công Nghệ Thông Tin
Thể loại Luận văn
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 22
Dung lượng 176,62 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nhận đạng và pán nhãn cho hình ảnh đóng vai trỏ quan trong trong nhiền ứng dụng thực tế về khoa học 17 đuật cũng như trong, cuộc ông thưởng ngày như: săn xuất và kiểm tra chất lượng, sự

Trang 1

PUAN MO DAU

Cimg voi sy phat triển ngày cảng auanh mẽ của khoa học kí thuật trong một vài thập kỷ gần dây, xử lý ảnh tuy là một ngành khoa hoc củn tương đôi indi mẻ øo với nhiền ngành khoa học khác nhưng, tiện nay nó dang là một trong những lình vực phhát triển rất nhanh và thu hút sự quan tâm đặc biệt từ các nhà khoa học, thúc đẩy các trang, tâm nghiên cửu, ứng dụng về lính vực hấp dẫn này

Nhận đạng và pán nhãn cho hình ảnh đóng vai trỏ quan trong trong nhiền ứng dụng thực tế về khoa học 17 đuật cũng như trong,

cuộc ông thưởng ngày như: săn xuất và kiểm tra chất lượng, sự di

chuyên cửa Rơbol, tác phương tiện đĩ lại tự trị, công cụ hướng dẫn

eho tigtời ml, an ninh và giám sát, nhận dang đối tượng, nhận dạng

mil, vac img dung trong y học, sản xuất, hiệu chính video,

Một trong những ứng đụng quan trọng, là việc nhận đạng và gắn nhăn cho các loại hình ảnh Tự động nhận dạng ảnh và đặt vị trí nhãn là một li: vực trong trực quan hóa thông từn Nhãn là các đoạn văn bản nhằm truyén dal thong tin, làm rõ ý nghĩa của các tấn trúc phức tạp được biểu điễn ở dạng đỗ họa

Bai toan nhan dang và gan nhãn đã được đề cập, nghiên cửu

nhiều trên thể giới Tại Việt Nam bài toán này cũng đang rất được chủ trọng và được ứng dụng trong rất nhiễu lĩnh vực Vì vậy, đề tài này được xây dựng với các mục đích: 'Lần hiểu về bài loàn nhận dạng, Tỉnh ảnh và gản nhấn, ứme đựng, của nó trong các Tĩnh vực, Tìm hiển

một số vẫn để, các thuật toán liên quan; Đặi nền lắng cho cả nhân nghiên cứu, tim hiển sâu hơn về vẫn để này Từ đỏ thiết kế một

chương trình thử nghiệm nhận dạng và gán nhãn cho một ảnh cụ thế

Luận văn gồm phẩn mở dẫu, phẫu kết luận và 3 chương, nội

dung che chong, nh sau:

Chương, 1: Khái quải về gắn nhãn và bài toán nhận dạng,

dối tượng

Trang 2

Chwong nay khai quát lại cơ bản những kiên thức

cán nhãn gằm xứ lý ánh vá gân nhãn trong, xử lý anh Dang thoi néi

về bài tuãn nhận dạng đối lượng, vai lrỏ và lẫm quan lrọng cửa bài toán nhận dang đối tượng, các phương pháp nhận đạng đổi tượng,

cũng như mội số hệ thông nhận dạng đổi lượng nổi tiếng trên thế giới

Chương 2: Một số vẫn để trong nhận đạng đối tượng sử

dụng mạng naran

Chương 2 để cập đến một số vẫn đề trong nhận đạng đổi tượng,

sử dụng mạng noron Mớ tả kiễn trúc của một hệ thông nhận dạng đối tượng sử đụng mang nơron nhân tạo và cách thiết kế, huấn luyện Trạng nơrơn nhân tạo cho việc nhận dạng,

Chương 3: Chương trình thữ nghiệm

Chương nay äp đụng các kiên thức nghiên cún trong chương 1

và chương 2, sử dụng ruạng nơron nhiều lớ lan truyền ngược và kỹ thuật pán nhân dễ xây đựng một chương trình nhận dang ky tụ

Trang 3

CHUONG 1: KUAI QUAT VE GAN NILAN VA BAI TOAN NHẬN DẠNG ĐÓI TƯỢNG

Chương mày khái qướt lại cư băn những kiên thức

gan nln gam sat ly anh vá sán nhãn trong xử lý ảnh Dẳng thời nói

về bài tuán nhận dạng đối lượng, vai trò và lẫm quan lrọng cửa bài

toán nhận đạng đối tượng, các phương pháp nhận đạng đối trọng,

cũng như mội số hệ thông nhận dạng đối tượng nổi tiếng trên thể

Xử lý ảnh là một phẩn của lĩnh vực xử lý tin hiện số Tăng,

cường, chất hrợng thông tin hinh ảnh đối với quả trình trí giác của cơn

người và biển điễn trên máy tỉnh Xử lý ảnh số bao gồm các phương,

pháp vả kỹ thnật để biển đổi, để trnyên Lãi hoặc mã hóa các ảnh tự

nhiên

Xử lý ảnh liên quan đến việc thay đổi hình ảnh để đạt được mời trong hai mục dich:

- Thứ nhất: biến đổi ảnh và làm đẹp ảnh

- Thứ bai: lự động phân tích nhận dạng ảnh hay đoán nhận ảnh

và đánh gid các nội dung cña ảnh

1 do phải xử Tý ảnh:

~ Ảnh có thể bị lỗi trong quả trình thu ảnh, truyền đẫn và hiển thi (hỗi phục, năng cao chất hượng ảnh, nội sny)

~ Ảnh có thể mang các nội dung nhạy cảm (vẻ, chống lại copy

*hông hợp pháp, etd mao va lita dao)

- Tạo các bức ảnh có hiệu ứng nghệ thuật

Có thể tạm phân biệt các hệ thông xử lý ảnh theo mức độ phức tap của thuật Loán xử lý như sau:

- Xử lý ảnh mức thấp: đó là các quá trình biển đổi đơn giân như thực hiện các bộ lọc nhằm khử nhiễu trong ảnh, lăng cường độ

Trang 4

tương phản hay độ né: của ảnh Trong trường hợp này, tín hiệu đưa

vào hệ thống xử lý và tin hiệu ở đâu +a là ảnh quang học

- Xử lý ảnh mức trưng: quá trình xử lý phức Lạp hơn, (hường được wit dung, dé phan lớp, phân doan ảnh xác định và đự đöan biên

ảnh, nén anh để lưu trữ hoặc truyền phái Đặc điểm của các hệ thống

xế lý ảnh nức trung là tín hiện đầu vào là hình ảnh, còn tin hiệu đân

Ta là các thành phân được tách ra từ hình ảnh gốc, hoặc luồng đữ liện nhận được sau khi nén ảnh

- Xử lý ảnh mnức cao: là quá trinh phân tích và nhận dạng hình ảnh Đây cũng là quá trình xử lý được tực hiện trong hệ thông thì giác cửa con người

Củng ta có thé thấy răng, không phải bắt kỳ một ứng đụng xử 1ỷ ảnh nào cũng, bắt buộc phãi tuân theo các bước xử lý đã nêu ở trên,

ví dụ như uác ứng dụng chỉnh sửa ảnh nghệ [huật chỉ dừng lại ở bước tiên xử lý Một cách tổng quát thủ những chức năng xử lý bao sắm cả nhận dạng và giải thích thường chỉ có mật trong hệ thông phản tích ảnh tự động hoặc bản tự động, được dùng để rút trích ra những thông, tin quan trạng từ ảnh, vi dụ như các ứng dụng nhận dạng kí tự quang hoc, nhận dạng chữ viết tay wv

1.1.2 Gần nhãn trong xữ lý ảnh

Nhấn là các đoạn văn bân nhằm truyền đạt thông tin, lam 16

ngiấa của các câu trủc phức tạp được biển điển ở dang, dé hoa Bai

toán tự đông gắn nhấn được xác định là một lính vực nghiên cứu quan trợng của ACM Compttational Geometry Task Eorce (Dội tính toán hình học ACM)

Gián nhấn là nguồn của nhiên bài toán tôi un héa hinh hoc Ngay cả khi nhãn được đặt vào vị trí cô định tương ứng với một điểm, đây vẫn là bài toản NP-harđ Các bản đổ cản được gán nhãn,

vậy cần cá các piãi thuật hiệu quả giải thuật henristies để xác định những ràng buộc, vị trí có thể

Trang 5

Giản nhãn cho đổi tượng là xác định nhãn phân loại cho từng thành phân trong đổi tượng quan sát được Gán nhãn cho đổi tượng, được sử dụng nhiều lrơng các bài loam gán nhãn Lừ loại, nhận dạng

nh ánh, âm thanh hay các bải toàn vẻ dự đoán gen

Day 1a bai toán có ứng dụng trong nhiều nh vực bao gồm vẽ 'ˆân đổ, hệ thống thông tín địa lý và vẽ đô thị Hiện trên thế giới đã có nhiều công trình nghiên cửu vẻ bài toán gán nhãn tự động Tuy nhiên

ở Việt Nam, bài toán này còn được để cập đến một cách hạn chế

‘Trong bai toán gán nhãn cho đổi tượng thành công, nhãn phải được đặt sao cho người xem đề đọc và theo tiêu chuẩn chất lượng, thấm mỹ cơ bản Nhẫn phải được đặt ở vi tr tốt nhất cô sẵn theo một

số quy tắc cơ bản: Nhãn phải được đễ đàng đọc, nhanh chóng xác định vị trí một nhãn và đổi tượng má nó thuộc vê thì nền được để đảng thừa nhữm, nhăn phải được đặt rất gần với các đổi lượng của chứng, nhần không được cha khuất các nhãn khác hoặc các đổi tượng,

*khác, một nhãn phải được đặt ở vị trí thích hợp nhất trong, số tất cả các vị trí đễ đọc Tóm tắt các đánh giá chất lượng gán nhãn trong ba quy tắc co ban sau đây:

- Không có sự chẳng chéo của một nhãn với các nhãn khác,

các đối tượng đỗ họa khác của bản vẽ

- Mỗi nhãn có thể đễ đàng được xác định là của đối tượng nao trong hình vẽ,

- Mỗi nhãn phải được đặt ở ví trí tốt nhất có thể (trong số tắt

cả các nhăn cỏ vị trí chấp nhận được) Thử tự hiển thị wu tiên giữa các vị trí nhân có thể thay đối tủy theo ứng dụng cụ thể

1.2 Bài toán nhận dạng đối tượng

1.2.1 Giới thiệu

Nhu chúng ta biết, sự xuất hiện hình ânh của một bể mặt pin thuộc vào nhiều yến (ỗ: Ánh sáng, các tháng số máy ảnh và định vị

máy ảnh Trong rất nhiễu Tính vực như điều khiển, tự động hóa, công,

nghệ thông tin , nhận đạng được đối tượng la vấn để mẫu chất

Trang 6

quyết định sự thành công của bai toán Nhận dạng là bước đầu tiên và

quan trọng nhất của nhiều B:ih vực khoa học, đặc biệt trong lĩnh vực

điều khiến và lự động hóa nêu không nhận dạng chúnh xác đối lượng

điều khiển thi sẽ không cỏ giải pháp tôi tru nhất để điển khiển chúng,

'Tử việc mội đối Lượng phải được nhận dạng Lừ sự xuất hiện của nhiêu vật thể, sự phức tạp của nhận đạng đối tượng phụ thuộc vào nhiều yếu tÔ Nhận dạng là quá trình phân loại các đổi trợng được biển điển theo một mô hình nào đó và gán chúng một tên (gán cho đối tượng một tên gọi, tức là một dang) dyva theo những quy luật và mẫu

chuẩn

1.2.2 Các cách tiếp cận

1.2.2.1, Nhận dạng đôi tượng dùng thống kê

Khái niêm: Nhân đạng đối tương đừng thông kế là một phương pháp nhận dạng đối tượng dựa vào các đặc tính thống kê các đối tượng Nhận đạng đối trợng dùng thống kê sử dụng các phương pháp máy học dựa trên thống kê để học và rút ra đối tượng, tham khảo tử một lượng đữ liệu lớn

1.2.3.2 Nhận dạng dựa then cần trúc

Biểu điển định tinh,

Trơna cách biển điễn này, người ta quan tâm đến các dang va

mỗi quan hệ giữa chủng Giả thiết rằng, mỗi đối tượng được biển

điền bởi một dãy ký tự, các đắc tính biển điễn hởi củng một số ký tị

Phương pháp nhận dạng ở dây là nhận dạng logic, dụs vào hàm phân

"biệt 1à hàm Bool Cách nhận dạng lã nhận đang các từ có củng độ dài 1.1.2.3, Nhận dạng dựu trên mạng nơyun

Giới thiện

XửI trường hợp đối lượng phi tuyến có độ phức Lạp cao, riểu

sử dung phương pháp giải tích thông thường để nhận đạng sẽ rất khó

khăn, thậm chí không thục hiện được do sự hiếu biết nghèo nàn và

đổi tượng, Vì vậy các nhà khoa học đá đưa ra ý trông là sử đụng

công cụ tỉnh toán mêm như hệ mở, mạng noron, đại số gia tử để xắp

lúa

Trang 7

xi -chính là nhận đạng đối tượng, Mạng nơron là một trong những,

công cụ hữu hiệu đế nhận đạng mô hinh đối tượng, bằng, phương,

tháp này ta không biết được mô hình toán thực sự cửa đổi lượng

nhưng hoán toàn có thế sử đựng kết quả xâp xỉ để thay thẻ đối tượng

Cau ine neural nhân tạo

Mô hình ngron nhân tạo gốm 3 phần chính: Bộ tổng liên kết

đâu vào, bộ động, học tuyến tỉnh và bộ phí tuyến

1.2.3 Một số hệ thống nhận đạng đổi tượng hiện nay

1.2.4 Qny trinh hoạt động của một hệ thống nhận dạng dải lugug

Trang 8

CIUONG 2: NUAN DANG DOI TƯỢNG

NGRON

Chương 2 dé cập đến một số vân đẻ Irong nhận dạng đổi

tượng sử dụng mạng Noren Mô tả kiến lrúc của một hệ thông nhận dạng đối tượng sử dụng mạng rtoron nhân lạo và cách thiết kế, huấn Tuyện mạng noron nhân tạo cho việc nhận đạng

2.1.1 Khái niệm mạng naron nhân tạa

Mạng nơron nhân tạo hay thường gọi ngắn gon 14 mang

noron, trong tiéng anh 14 Artificial Neural Network Né gm cé mét nhóm các noron nhân tạo nói với nhau, và xử lý thông tin bằng cách

truyền theo các kết nỗi vả lính giá trị mới tại các nút Trong nhiêu

urường hợp, mạng noron nhân lạu là mội hệ thong thích ứng, tự thay đối câu trúc của mình dựa trên các thông tin bên ngoài hay bên trong chây qua mạng trong quá trinh học

2.1.2 Lịch sử phát triển của mạng nơron

2.1.3 Mồ hình ngron

2.1.3.1 Nơrun nhân lụo đơn giản

Một neron nhân tạo đơn giản lã một thiết bi với nhiền đâu

vào và có một đâu ra Nơron có lai chế độ hoạt động: ch

luyện và chế đô sử đụng, Trong chả độ huẫn luyện, noron có thế được huấn luyện với một số các đổi Lượng đầu vào tới khi không được sử đụng sữa Trang chê dộ sử đụng thì khi phát hiện một đôi

tượng đã học tại đầu vào, đầu ra của nó sẽ lrở thành đầu ra hiện tại

'éếu dôi tượng đầu vào không thuộc vào đanh sách dôi tượng đã học

thi luật loại bỏ được sử đựng đẻ tiếp tục đùng hay loại bỏ niơron

2.1.3.2 Nơron phức tạp hơn (Mô bình McCuHoch và Pitts: MCP)

lật với mô hình đơn giản ở trên là dâu vào của mô

Trình này có Irọng số, hiệu quả của nó là muỗi đâu vào có mội sự đưa

Trang 9

za quyét dinh plra thudc vao trọng số của từng đâu vào Trọng số của một đẫu vào là một số mà khi nhân với dầu vào thí ta có được trọng

số đân vào Những đầu vào trọng số nảy được nhám Tại với nhan va

nêu chứng vượt quá giá trị ngưỡng thả nơrơn sẽ bị loại bỏ Với các trường hợp khác thì ngron không bị loại bỏ

2.1.4 So sánh mạng noron với máy tinh truyén thống

2.1.5 Mật số kiến trúc mạng noron dùng nhận đạng dối tượng 2.1.5.1 Mạng truyền thẳng

Mạng truyền thẳng cho phép tín hiệu truyễn chí theo một đường từ đân vào tới đầu ra, không có sự phản hồi hay lập lại Mang nay có xu hướng (ruyễn thẳng giữa dâu vào với đầu ra Chúng được

đng rộng rãi trong nhận đạng đối tượng, Cách tả chức trong mang

truyền thống là tham chiếu tới phương pháp tử đưới lên hoặc là từ

trên xuống,

2.1.5.2 Mạng hổi quy

Mạng hải quy có kiễn trúc tương tt mang truyền thắng (hình

2.3) nhưng có điểm khác nhau đó là nó cho phép tín hiệu truyền theo

cả hai hướng Mang hồi quy truyền tín hiệu rảt tết và có thể trở lên rất phức tạp Nó có tính động; trạng (hứi của nó thay đổi liên Lục tới Shi đạt tới điểm trạng thai cin bing Ching đuy tri điểm

cân bảng tới khi đân vào thay đổi và cần tìm một một Irạng thái cân

'°ằng mới Kiễn trúc bồi quy có thể tham chiêu tới

2.1.5.3 Các lớp mạng

Các loại phổ biển nhất của mạng nơron nhân tạo bao gốm ba nhóm hoặc lớp của các đư vị: một lớp của các đưn vị "đầu vào” được kết nỗi với một lúp của các đơn vị "ẩn", và lớp don vi “An” nay được kết nỗi với một lớp cña đơn vị "đầu ra”

Trang 10

duge dat ra bi Frank Rosenblatt Perceptron (hinth 2.5) tré thank mét

Tô hình MCP (noron với dau vào trọng sô) với một số bố sưng, sửa

chữa, tiền xử lý Các đơn vị có nhần À1, A2, Aj, Ap được gọi là đơn

vị kết nói vả nhiệm vụ của chúng là trích xuât các đặc điểm riêng biệt

từ những hình ảnh đâu vào

2.1.6 Ứng dụng của mạng nơron nhân tạo

3.2 Thiết kế mạng nornn nhân tạo

»_ Bước 2: Thu thập đứ liệu

© Bude 3: Tiền xử lý dữliệu

» _ Buớc 4: Các tập đữ liệu huấn luyện, kiểm thở, và chứng,

"Hước 7: Triển khai

2.2.1 Chỉ tiết các bước thiết kế một mang noron

2.2.1.1 Lựa chọu biển

Trang 11

Tmong muốn được gọi là học hay huản luyện

2.3.2, Hục có giám sái (ron các iạng nơron

Học cớ giảm sát có thế được xem rửa việc x4p xi một ảnh xạ:

X— Y trong đó X là tập các vẫn đề và Y là tập các lời giải tương,

me cho vẫn đê đô Các đổi tượng (x y) với x = (X1, X2 , xn) E XÃ, y

=(l.y2, ym) € Y được cho trước

2.3.3 Thuật Luán lan truyền ngược Hack-Propaeation

Thmat toán lan truyền ngược là dạng tổng quát của thuật toán

trung bình bình phương lối thiểu 'Thuậi loán này thuộc dạng thuật loan sap xi dé tim cae điểm mà tại đó hiệu năng của mạng là tối ưu Chí số tôi ưu thường được xác định bởi một ham số cúa ma trận trong,

số và cáo đâu vào nào đó mã trong qua trình tìm hiển

bài toán đất ra

3.3.3.1 Mô tả thuật toán

Mạng lan trụ

hư ngược là mội hàm phí luyến có Lhể xấp xỉ

sẵn đúng nhất một hàm đích được cho qua một số đối tượng trong,

tập đôi tợng Một mạng lan truyền tống gái 1ä một mạng cd n (n>2) lớp: lớp thứ nhất sợi là lớn nhập, lớp thứ n lã lớp xuÂt và n-2 lớp ấn

Phần lớn các mạng chủ có một biển phụ thuộc nhưng với mỏ hình La

trên mạng nơron cho phép số nút trong lớp nhập, lớp xuất, và lớp ân

12

Ngày đăng: 31/05/2025, 13:21

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm