1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Điểm bất động và ứng dụng trong nhận dạng đối tượng

16 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 16
Dung lượng 377,4 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nhƣ vậy bài toán nhận dạng đối tƣợng dựa vào các đặc trƣng bất biến mà nền tảng là dựa vào các điểm bất động là một cách tiếp cận mới trong khoa học nhận dạng, là cơ sở để xây dựng nh[r]

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỊ LOAN

ĐIỂM BẤT ĐỘNG VÀ ỨNG DỤNG TRONG NHẬN

DẠNG ĐỐI TƯỢNG

LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH: CÔNG

NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN: TS ĐỖ NĂNG TOÀN

NĂM 2007

Trang 2

LỜI CẢM ƠN

Luận văn được hoàn thành dưới sự hướng dẫn nhiệt tình và chu đáo của thầy Đỗ Năng Toàn Lời đầu tiên em xin gởi lời cảm ơn chân thành và sâu sắc đến thầy

Em bày tỏ lòng biết ơn đến các thầy giáo, cô giáo trong trường Đại học Quy Nhơn, trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã chỉ bảo, giúp đỡ cũng như có ý kiến đóng góp quý báu cho em trong quá trình học tập tại trường

Cuối cùng tôi chân thành cảm ơn gia đình và tất cả các bạn bè đã động viên và giúp đỡ tôi trong những lúc khó khăn

Hà Nội, ngày 02 tháng 11 năm 2007

Tác giả

Nguyễn Thị Loan

Trang 3

CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT

Trang 4

DANH MỤC CÁC HÌNH VẼ

Hình 1.1 Sơ đồ tổng quát một hệ nhận dạng 9 Hình 1.2 Hai đối tượng trên mặt phẳng Error! Bookmark not defined

Hình 1.3 Các tứ giác và hình tròn trên mặt phẳng hai chiềuError! Bookmark

not defined

Hình 1.4 Ví dụ về các bất biến hình học đối phép quay và tịnh tiến Error! Bookmark not defined

Hình 2.2 Các mức khác nhau trong một thể hiện không gian tỷ lệ Error! Bookmark not defined

Hình 2.3 Ví dụ về các tỷ lệ đặc trưng Error! Bookmark not defined

Hình 2.5 Điểm quan tâm bất biến tỷ lệ trong các ảnh bị biến đổi affine Error! Bookmark not defined

defined

Hình 2.7 Phát hiện lặp lại của một điểm quan tâm bất biến affine Error! Bookmark not defined

defined

defined

not defined

Hình 2.12 Bộ mô tả điểm khóa Error! Bookmark not defined

Bookmark not defined

trong ảnh (b) có trong ảnh (a) không? Error! Bookmark not defined

Hình 3.3 Giao diện chương trình Error! Bookmark not defined

Trang 5

Hình 3.4 (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh huấn luyện; Error! Bookmark not defined

(c) Kết quả nhận dạng Error! Bookmark not defined

defined

(b) Ảnh chứa đối tƣợng cần nhận dạng; (c) Kết quả nhận dạng Error! Bookmark not defined

Trang 6

MỞ ĐẦU

Trong cuộc sống hằng ngày, chúng ta thường xuyên cần phải nhận dạng và phân biệt vô số các đối tượng kể cả các đối tượng quen thuộc và các đối tượng mới lạ Các đối tượng này có thể biến đổi đôi chút về hình thức, màu sắc, kết cấu, v.v… Các đối tượng được nhận dạng từ nhiều tư thế khác nhau (từ phía trước, bên cạnh hoặc phía sau), ở nhiều nơi và trong nhiều kích thước khác nhau Các đối tượng thậm chí có thể được nhận dạng khi chúng bị che khuất một phần bởi các đối tượng khác Vì vậy, việc nhận dạng đối tượng một cách tự động là một vấn đề hết sức thiết thực trong một xã hội hiện đại

Ngày nay, với sự phát triển mạnh mẽ của ngành Khoa học máy tính cũng như sự bùng nổ của lĩnh vực Công nghệ thông tin đã đẩy nhanh sự phát triển của nhiều lĩnh vực xã hội như quân sự, y học, giáo dục, kinh tế, giải trí v.v… Sự phát triển của phần cứng cả về phương diện thu nhận, hiển thị, cùng với tốc độ

xử lý đã mở ra nhiều hướng mới cho sự phát triển phần mềm, đặc biệt là Công nghệ xử lý ảnh phát triển nhanh Nó có thể giải quyết được bài toán phát hiện, nhận dạng tự động các loại đối tượng trong thực tế, chẳng hạn có thể tạo ra hệ thống phát hiện kẻ gian đột nhập vào các cơ quan cần được giám sát sau giờ hành chính như các Kho bạc, Ngân hàng v.v thay vì cần phải có những đội bảo

vệ canh gác cẩn thận Nhận dạng mặt người trong một bức ảnh cũng đã có rất nhiều ý nghĩa trong quân sự, an ninh v.v Rõ ràng bài toán phát hiện đối tượng cũng như nhận dạng đối tượng ngày càng quan trọng đối với sự phát triển của xã hội, đặc biệt rất quan trọng cho xã hội Việt Nam

Bài toán nhận dạng đối tượng là một trong những bài toán cốt yếu trong các lĩnh vực nhận dạng hay thị giác máy, nó là cơ sở cho nhiều ứng dụng quan trọng Nhận dạng đối tượng có rất nhiều cách tiếp cận để giải quyết, mặc dù mỗi một loại đối tượng sẽ có một kỹ thuật cụ thể, song chúng vẫn có một cơ sở chung Một trong những nguyên nhân quyết định cho chất lượng nhận dạng đối tượng trong ảnh đó chính là việc trích chọn đặc trưng Các đặc trưng được trích chọn thường dựa vào các đặc trưng bất biến

Lý thuyết về điểm bất động đã được nghiên cứu nhiều trong toán học và vật

lý Việc nghiên cứu áp dụng lý thuyết này để trích chọn đặc điểm phục vụ cho

Trang 7

nhận dạng trong xử lý ảnh là hướng tiếp cận mới và có nhiều hứa hẹn nhất là đối với các đối tượng có sự biến đổi về kích thước, hình dạng, các đối tượng bị che khuất một số bộ phận hoặc đối tượng chuyển động v.v Như vậy bài toán nhận dạng đối tượng dựa vào các đặc trưng bất biến mà nền tảng là dựa vào các điểm bất động là một cách tiếp cận mới trong khoa học nhận dạng, là cơ sở để xây dựng nhiều ứng dụng quan trọng và cần thiết

Trên đây đã điểm qua tầm quan trọng của bài toán nhận dạng đối tượng, đặc biệt là các đối tượng bị biến đổi đã cho ta thấy rõ tính cần thiết cũng như tính thời sự đồng thời là ý nghĩa khoa học và thực tiễn của vấn đề Nhận thức

được điều này, tôi đã chọn đề tài luận văn: “Điểm bất động và ứng dụng trong nhận dạng đối tượng”

Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chương nội dung được tổ chức như sau:

Chương 1: Tổng quan về bất biến và nhận dạng đối tượng

Chương này trình bày định nghĩa các loại bất biến, lý thuyết điểm bất động, cũng như bài toán nhận dạng đối tượng và cách giải quyết

Chương 2: Các phương pháp xác định điểm bất động trong ảnh

Chương này trình bày các kỹ thuật xác định các điểm bất động trong ảnh để xây dựng các đặc trưng bất biến của đối tượng và sử dụng các đặc trưng này cho việc so khớp nhận dạng đối tượng

Chương 3: Ứng dụng điểm bất động trong nhận dạng đối tượng

Trong phần này luận văn trình bày ứng dụng nhận dạng đối tượng dựa vào các đặc trưng bất biến được xây dựng từ các điểm bất động, cài đặt thử nghiệm một phương pháp đã trình bày ở chương 2

Trang 8

Chương 1 –

TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG

ĐỐI TƯỢNG

Chương này trình bày tổng quan về bài toán nhận dạng đối tượng trong ảnh, đề cập đến hai vần đề chính là các dạng bất biến trong ảnh và lý thuyết điểm bất động

1.1 Tổng quan về nhận dạng

Trong lý thuyết nhận dạng nói chung và nhận dạng ảnh nói riêng có 3 cách tiếp cận khác nhau:

- Nhận dạng dựa vào phân hoạch không gian

- Nhận dạng cấu trúc

- Nhận dạng dựa vào kỹ thuật mạng nơron

Hai cách tiếp cận đầu là các kỹ thuật kinh điển Các đối tượng ảnh được quan sát và thu nhận được phải trải qua giai đoạn tiền xử lý nhằm tăng cường chất lượng, làm nổi các chi tiết, tiếp theo là trích chọn và biểu diễn các đặc trưng

và cuối cùng mới qua giai đoạn nhận dạng Cách tiếp cận thứ ba hoàn toàn khác

Nó dựa vào cơ chế đoán nhận, lưu trữ và phân biệt đối tượng mô phỏng theo hoạt động của hệ thần kinh con người Do cơ chế đặc biệt, các đối tượng thu nhận bởi thị giác người không cần qua giai đoạn cải tiến mà chuyển sang giai đoạn tổng hợp, đối sánh các mẫu đã lưu trữ để nhận dạng

Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo một mô hình nào đó và gán cho chúng một lớp (gán cho đối tượng một tên gọi) dựa theo các quy luật và các mẫu chuẩn Quá trình nhận dạng dựa vào những mẫu học

biết trước gọi là nhận dạng có thầy hay học có thầy; trong trường hợp ngược lại gọi là học không có thầy

Trang 9

1.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch

1.1.1.1 Không gian biểu diễn đối tượng

Các đối tượng khi quan sát hay thu nhận được, thường được biểu diễn bởi tập các đặc trưng hay đặc tính Như trong trường hợp xử lý ảnh, ảnh sau khi được tăng cường để nâng cao chất lượng, phân vùng và trích chọn đặc tính được biểu diễn bởi các đặc trưng như biên, miền đồng nhất, v.v Người ta thường phân các đặc trưng này theo các loại như: đặc trưng tôpô, đặc trưng hình học và đặc trưng chức năng Việc biểu diễn ảnh theo đặc trưng nào là tùy thuộc vào từng ứng dụng

Ở đây ta đưa ra một cách hình thức cho việc biểu diễn các đối tượng Giả

không gian đối tượng X được định nghĩa:

X = { X1, X2,…, Xm}

xem xét chúng ta chỉ xét tập X là hữu hạn

1.1.1.2 Không gian diễn dịch

Không gian diễn dịch là tập các tên gọi của đối tượng Kết thúc quá trình nhận dạng ta xác định được tên gọi cho các đối tượng trong tập không gian đối tượng hay nói cách khác là đã nhận dạng được đối tượng Một cách hình thức gọi  là tập tên đối tượng:

 = {w1, w2, …, wk} với wi, i = 1, 2,…, k là tên của các đối tượng

1.1.2 Mô hình và bản chất của quá trình nhận dạng

1.1.2.1 Mô hình

Việc lựa chọn một quá trình nhận dạng có liên quan mật thiết đến kiểu mô

tả mà người ta sử dụng để đặc tả đối tượng Trong nhận dạng, người ta phân chia làm hai họ lớn:

Trang 10

- Họ mô tả theo tham số

- Họ mô tả theo cấu trúc

Cách mô tả được lựa chọn sẽ xác định mô hình của đối tượng Như vậy, chúng

ta sẽ có hai loại mô hình: mô hình theo tham số và mô hình theo cấu trúc

* Mô hình tham số: sử dụng một vectơ để đặc tả đối tượng Mỗi phần tử của

vectơ mô tả một đặc tính của đối tượng Ví dụ trong các đặc trưng chức năng, người ta sử dụng các cơ sở trực giao để biểu diễn Và như vậy, ảnh sẽ được biểu diễn bởi một chuỗi các hàm trực giao Giả sử C là đường bao của ảnh và C(i,j) là điểm thứ i trên đường bao, i = 1, 2,…, N (đường bao gồm N điểm)

1

1

N

N

i

1

1

N

N

i

là tọa độ tâm điểm Như vậy, moment trung tâm bậc p, q của đường bao là:

N

pq i 0 i 0

1

1

N i

Vectơ tham số trong trường hợp này chính là các moment ij với i = 1, 2,…, p

và j = 1, 2,…, q Còn trong số các đặc trưng hình học, người ta sử dụng chu tuyến, đường bao, diện tích và tỷ lệ T = 4S/p2, với S là diện tích, p là chu tuyến

Việc lựa chọn phương pháp biểu diễn sẽ làm đơn giản cách xây dựng Tuy nhiên, việc lựa chọn đặc trưng nào là hoàn toàn phụ thuộc vào ứng dụng

* Mô hình cấu trúc: cách tiếp cận của mô hình này dựa vào việc mô tả đối

tượng nhờ một số khái niệm biểu thị các đối tượng cơ sở trong ngôn ngữ tự nhiên Để mô tả đối tượng, người ta dùng một số dạng nguyên thủy như đoạn thẳng, cung, v.v… Trong mô hình này, người ta sử dụng một bộ ký hiệu kết thúc

sản xuất để mô tả cách xây dựng các đối tượng phù hợp dựa trên các đối tượng

chấp nhận một khẳng định là: cấu trúc một dạng là kết quả của việc áp dụng luật sản xuất theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu Một

Trang 11

cách hình thức, ta có thể coi mô hình này tương đương một văn phạm G = (Vt,

Vn, P, S) với:

- Vt là bộ ký hiệu kết thúc,

- Vn là bộ ký hiệu không kết thúc,

- P là luật sản xuất,

- S là dạng (ký hiệu bắt đầu)

1.1.2.2 Bản chất của quá trình nhận dạng

Quá trình nhận dạng gồm 3 giai đoạn chính:

- Lựa chọn mô hình biểu diễn đối tượng

- Lựa chọn luật ra quyết định (phương pháp nhận dạng) và suy diễn quá trình học

- Học nhận dạng

Khi mô hình biểu diễn đối tượng đã được xác định, có thể là định lượng (mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển sang giai đoạn học Học là giai đoạn rất quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tượng thành các lớp

Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đối tượng vào một lớp hay nói cách khác gán cho đối tượng một tên

Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống nhận dạng có thể tóm tắt theo sơ đồ sau:

Hình 1.1 Sơ đồ tổng quát một hệ nhận dạng 1.1.3 Bài toán nhận dạng đối tượng ảnh

Cho trước các đối tượng hai chiều Tồn tại nhiều bài toán nhận dạng khác nhau đối với các đối tượng ảnh hai chiều

Trích chọn đặc trưng

biểu diễn đối tượng

Phân lớp

trả lời

Trang 12

TÀI LIỆU THAM KHẢO

Tiếng Việt

Bách khoa Hà Nội

Tiếng Anh

correspondences International Journal of Computer Vision, 25(2):145- 166

views In Conference on Computer Vision and Pattern Recognition, Hilton

Head, South Carolina, pp 774-781

[4] Brown, M and Lowe, D.G 2002 Invariant features from interest point

groups In The 13th British Machine Vision Conference, Cardiff

University, UK, pp 253–262

In Alvey Vision Conference, pages 147–152

at different scales Journal of Applied Statistics, 21(2):224-270

In International Conference on Computer Vision, Corfu, Greece, pp 1150-1157

keypoints International Journal of Computer Vision

transformations, Ph.D thesis, Institut National Polytechnique de

Grenoble, France

[10] Mikolajczyk, K., and Schmid, C 2004 Scale & affine invariant interest

point detectors International Journal of Computer Vision 60(1), 63-86

Trang 13

[11] Mikolajczyk, K and Schmid, C 2005 A performance evaluation of local

descriptors In IEEE Transactions on Pattern Analysis and Machine

Intelligence

[12] Rothganger, F., Lazebnik, S., Schmid, C and Ponce J 2005 Object

modeling and recognition using local affine-invariant image descriptors and multi-view spatial consraints In International Journal of Computer Vision

[13] http://en.wikipedia.org/wiki/Fixed-point_theorem

[14] http://signal.ece.utexas.edu/seminars/dsp_seminars/02spring/danilo.html [15] http://www.hindawi.com/journals/fpta/guidelines.html

[16] http://www.icassp2003.com/archives/5

Trang 14

MỤC LỤC

CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT 2

DANH MỤC CÁC HÌNH VẼ 3

MỞ ĐẦU 4

Chương 1 TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG 6

ĐỐI TƯỢNG 6

1.1 Tổng quan về nhận dạng 6

1.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch 7

1.1.1.1 Không gian biểu diễn đối tượng 7

1.1.1.2 Không gian diễn dịch 7

1.1.2 Mô hình và bản chất của quá trình nhận dạng 7

1.1.2.1 Mô hình 7

1.1.2.2 Bản chất của quá trình nhận dạng 9

1.1.3 Bài toán nhận dạng đối tượng ảnh 9

1.2 Tổng quan về bất biến và vai trò của bất biến trong nhận dạng Error! Bookmark not defined

1.2.1 Bất biến moment thống kê Error! Bookmark not defined

1.2.2 Bất biến hình học Error! Bookmark not defined

1.2.3 Bất biến đại số Error! Bookmark not defined

1.2.4 Vai trò của bất biến trong nhận dạng Error! Bookmark not defined

1.3 Điểm bất động và vai trò của điểm bất động trong nhận dạng Error! Bookmark not defined

1.3.1 Lý thuyết điểm bất động Error! Bookmark not defined

1.3.2 Vai trò của điểm bất động trong nhận dạng đối tượng Error! Bookmark not defined

1.3.2.1 Trích chọn các đặc trưng bất biến từ các điểm bất động

Error! Bookmark not defined

1.3.2.2 So khớp đặc trưng Error! Bookmark not defined Chương 2 CÁC PHƯƠNG PHÁP XÁC ĐỊNH ĐIỂM BẤT ĐỘNG Error!

Bookmark not defined

Trang 15

TRONG ẢNH Error! Bookmark not defined

2.1 Phương pháp Harris Error! Bookmark not defined

2.2 Phương pháp Harris-Laplace Error! Bookmark not defined

2.2.1 Sự thể hiện không gian tỷ lệ Error! Bookmark not defined

2.2.2 Hàm Harris thích nghi tỷ lệ Error! Bookmark not defined

2.2.3 Sự lựa chọn tỷ lệ tự động Error! Bookmark not defined

2.2.3 Thuật toán phát hiện điểm bất biến Harris-LaplaceError! Bookmark not defined

2.2.3.1 Thuật toán Harris-Laplace Error! Bookmark not defined

2.2.3.2 Thuật toán Harris-Laplace đơn giản Error! Bookmark not defined

2.2.3.3 Ví dụ về các điểm bất biến Error! Bookmark not defined

defined

2.3.1 Động cơ thúc đẩy Error! Bookmark not defined

2.3.2 Ma trận moment cấp hai affine Error! Bookmark not defined

2.3.2.1 Phép biến đổi affine của ma trận moment cấp hai Error! Bookmark not defined

2.3.2.2 Phép đo tính đẳng hướng Error! Bookmark not defined

2.3.3 Phương pháp phát hiện điểm bất biến Harris-Affine Error! Bookmark not defined

2.4 Phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” Error! Bookmark not defined

2.4.1 Phát hiện cực trị không gian tỷ lệ Error! Bookmark not defined

2.4.1.1 Tần số lấy mẫu theo tỷ lệ Error! Bookmark not defined

2.4.1.2 Tần số lấy mẫu trong một vùng không gian Error! Bookmark not defined

2.4.2 Định vị chính xác điểm khóa Error! Bookmark not defined

2.4.3 Gán hướng cho các điểm khóa Error! Bookmark not defined

2.4.4 Bộ mô tả ảnh cục bộ Error! Bookmark not defined

2.5 Kết luận Error! Bookmark not defined Chương 3 ỨNG DỤNG ĐIỂM BẤT ĐỘNG TRONGError! Bookmark not

defined

NHẬN DẠNG ĐỐI TƯỢNG Error! Bookmark not defined

Ngày đăng: 14/05/2021, 21:49

🧩 Sản phẩm bạn có thể quan tâm

w