Nhƣ vậy bài toán nhận dạng đối tƣợng dựa vào các đặc trƣng bất biến mà nền tảng là dựa vào các điểm bất động là một cách tiếp cận mới trong khoa học nhận dạng, là cơ sở để xây dựng nh[r]
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THỊ LOAN
ĐIỂM BẤT ĐỘNG VÀ ỨNG DỤNG TRONG NHẬN
DẠNG ĐỐI TƯỢNG
LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH: CÔNG
NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN: TS ĐỖ NĂNG TOÀN
NĂM 2007
Trang 2LỜI CẢM ƠN
Luận văn được hoàn thành dưới sự hướng dẫn nhiệt tình và chu đáo của thầy Đỗ Năng Toàn Lời đầu tiên em xin gởi lời cảm ơn chân thành và sâu sắc đến thầy
Em bày tỏ lòng biết ơn đến các thầy giáo, cô giáo trong trường Đại học Quy Nhơn, trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã chỉ bảo, giúp đỡ cũng như có ý kiến đóng góp quý báu cho em trong quá trình học tập tại trường
Cuối cùng tôi chân thành cảm ơn gia đình và tất cả các bạn bè đã động viên và giúp đỡ tôi trong những lúc khó khăn
Hà Nội, ngày 02 tháng 11 năm 2007
Tác giả
Nguyễn Thị Loan
Trang 3CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
Trang 4DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Sơ đồ tổng quát một hệ nhận dạng 9 Hình 1.2 Hai đối tượng trên mặt phẳng Error! Bookmark not defined
Hình 1.3 Các tứ giác và hình tròn trên mặt phẳng hai chiềuError! Bookmark
not defined
Hình 1.4 Ví dụ về các bất biến hình học đối phép quay và tịnh tiến Error! Bookmark not defined
Hình 2.2 Các mức khác nhau trong một thể hiện không gian tỷ lệ Error! Bookmark not defined
Hình 2.3 Ví dụ về các tỷ lệ đặc trưng Error! Bookmark not defined
Hình 2.5 Điểm quan tâm bất biến tỷ lệ trong các ảnh bị biến đổi affine Error! Bookmark not defined
defined
Hình 2.7 Phát hiện lặp lại của một điểm quan tâm bất biến affine Error! Bookmark not defined
defined
defined
not defined
Hình 2.12 Bộ mô tả điểm khóa Error! Bookmark not defined
Bookmark not defined
trong ảnh (b) có trong ảnh (a) không? Error! Bookmark not defined
Hình 3.3 Giao diện chương trình Error! Bookmark not defined
Trang 5Hình 3.4 (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh huấn luyện; Error! Bookmark not defined
(c) Kết quả nhận dạng Error! Bookmark not defined
defined
(b) Ảnh chứa đối tƣợng cần nhận dạng; (c) Kết quả nhận dạng Error! Bookmark not defined
Trang 6MỞ ĐẦU
Trong cuộc sống hằng ngày, chúng ta thường xuyên cần phải nhận dạng và phân biệt vô số các đối tượng kể cả các đối tượng quen thuộc và các đối tượng mới lạ Các đối tượng này có thể biến đổi đôi chút về hình thức, màu sắc, kết cấu, v.v… Các đối tượng được nhận dạng từ nhiều tư thế khác nhau (từ phía trước, bên cạnh hoặc phía sau), ở nhiều nơi và trong nhiều kích thước khác nhau Các đối tượng thậm chí có thể được nhận dạng khi chúng bị che khuất một phần bởi các đối tượng khác Vì vậy, việc nhận dạng đối tượng một cách tự động là một vấn đề hết sức thiết thực trong một xã hội hiện đại
Ngày nay, với sự phát triển mạnh mẽ của ngành Khoa học máy tính cũng như sự bùng nổ của lĩnh vực Công nghệ thông tin đã đẩy nhanh sự phát triển của nhiều lĩnh vực xã hội như quân sự, y học, giáo dục, kinh tế, giải trí v.v… Sự phát triển của phần cứng cả về phương diện thu nhận, hiển thị, cùng với tốc độ
xử lý đã mở ra nhiều hướng mới cho sự phát triển phần mềm, đặc biệt là Công nghệ xử lý ảnh phát triển nhanh Nó có thể giải quyết được bài toán phát hiện, nhận dạng tự động các loại đối tượng trong thực tế, chẳng hạn có thể tạo ra hệ thống phát hiện kẻ gian đột nhập vào các cơ quan cần được giám sát sau giờ hành chính như các Kho bạc, Ngân hàng v.v thay vì cần phải có những đội bảo
vệ canh gác cẩn thận Nhận dạng mặt người trong một bức ảnh cũng đã có rất nhiều ý nghĩa trong quân sự, an ninh v.v Rõ ràng bài toán phát hiện đối tượng cũng như nhận dạng đối tượng ngày càng quan trọng đối với sự phát triển của xã hội, đặc biệt rất quan trọng cho xã hội Việt Nam
Bài toán nhận dạng đối tượng là một trong những bài toán cốt yếu trong các lĩnh vực nhận dạng hay thị giác máy, nó là cơ sở cho nhiều ứng dụng quan trọng Nhận dạng đối tượng có rất nhiều cách tiếp cận để giải quyết, mặc dù mỗi một loại đối tượng sẽ có một kỹ thuật cụ thể, song chúng vẫn có một cơ sở chung Một trong những nguyên nhân quyết định cho chất lượng nhận dạng đối tượng trong ảnh đó chính là việc trích chọn đặc trưng Các đặc trưng được trích chọn thường dựa vào các đặc trưng bất biến
Lý thuyết về điểm bất động đã được nghiên cứu nhiều trong toán học và vật
lý Việc nghiên cứu áp dụng lý thuyết này để trích chọn đặc điểm phục vụ cho
Trang 7nhận dạng trong xử lý ảnh là hướng tiếp cận mới và có nhiều hứa hẹn nhất là đối với các đối tượng có sự biến đổi về kích thước, hình dạng, các đối tượng bị che khuất một số bộ phận hoặc đối tượng chuyển động v.v Như vậy bài toán nhận dạng đối tượng dựa vào các đặc trưng bất biến mà nền tảng là dựa vào các điểm bất động là một cách tiếp cận mới trong khoa học nhận dạng, là cơ sở để xây dựng nhiều ứng dụng quan trọng và cần thiết
Trên đây đã điểm qua tầm quan trọng của bài toán nhận dạng đối tượng, đặc biệt là các đối tượng bị biến đổi đã cho ta thấy rõ tính cần thiết cũng như tính thời sự đồng thời là ý nghĩa khoa học và thực tiễn của vấn đề Nhận thức
được điều này, tôi đã chọn đề tài luận văn: “Điểm bất động và ứng dụng trong nhận dạng đối tượng”
Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chương nội dung được tổ chức như sau:
Chương 1: Tổng quan về bất biến và nhận dạng đối tượng
Chương này trình bày định nghĩa các loại bất biến, lý thuyết điểm bất động, cũng như bài toán nhận dạng đối tượng và cách giải quyết
Chương 2: Các phương pháp xác định điểm bất động trong ảnh
Chương này trình bày các kỹ thuật xác định các điểm bất động trong ảnh để xây dựng các đặc trưng bất biến của đối tượng và sử dụng các đặc trưng này cho việc so khớp nhận dạng đối tượng
Chương 3: Ứng dụng điểm bất động trong nhận dạng đối tượng
Trong phần này luận văn trình bày ứng dụng nhận dạng đối tượng dựa vào các đặc trưng bất biến được xây dựng từ các điểm bất động, cài đặt thử nghiệm một phương pháp đã trình bày ở chương 2
Trang 8Chương 1 –
TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG
ĐỐI TƯỢNG
Chương này trình bày tổng quan về bài toán nhận dạng đối tượng trong ảnh, đề cập đến hai vần đề chính là các dạng bất biến trong ảnh và lý thuyết điểm bất động
1.1 Tổng quan về nhận dạng
Trong lý thuyết nhận dạng nói chung và nhận dạng ảnh nói riêng có 3 cách tiếp cận khác nhau:
- Nhận dạng dựa vào phân hoạch không gian
- Nhận dạng cấu trúc
- Nhận dạng dựa vào kỹ thuật mạng nơron
Hai cách tiếp cận đầu là các kỹ thuật kinh điển Các đối tượng ảnh được quan sát và thu nhận được phải trải qua giai đoạn tiền xử lý nhằm tăng cường chất lượng, làm nổi các chi tiết, tiếp theo là trích chọn và biểu diễn các đặc trưng
và cuối cùng mới qua giai đoạn nhận dạng Cách tiếp cận thứ ba hoàn toàn khác
Nó dựa vào cơ chế đoán nhận, lưu trữ và phân biệt đối tượng mô phỏng theo hoạt động của hệ thần kinh con người Do cơ chế đặc biệt, các đối tượng thu nhận bởi thị giác người không cần qua giai đoạn cải tiến mà chuyển sang giai đoạn tổng hợp, đối sánh các mẫu đã lưu trữ để nhận dạng
Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo một mô hình nào đó và gán cho chúng một lớp (gán cho đối tượng một tên gọi) dựa theo các quy luật và các mẫu chuẩn Quá trình nhận dạng dựa vào những mẫu học
biết trước gọi là nhận dạng có thầy hay học có thầy; trong trường hợp ngược lại gọi là học không có thầy
Trang 91.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch
1.1.1.1 Không gian biểu diễn đối tượng
Các đối tượng khi quan sát hay thu nhận được, thường được biểu diễn bởi tập các đặc trưng hay đặc tính Như trong trường hợp xử lý ảnh, ảnh sau khi được tăng cường để nâng cao chất lượng, phân vùng và trích chọn đặc tính được biểu diễn bởi các đặc trưng như biên, miền đồng nhất, v.v Người ta thường phân các đặc trưng này theo các loại như: đặc trưng tôpô, đặc trưng hình học và đặc trưng chức năng Việc biểu diễn ảnh theo đặc trưng nào là tùy thuộc vào từng ứng dụng
Ở đây ta đưa ra một cách hình thức cho việc biểu diễn các đối tượng Giả
không gian đối tượng X được định nghĩa:
X = { X1, X2,…, Xm}
xem xét chúng ta chỉ xét tập X là hữu hạn
1.1.1.2 Không gian diễn dịch
Không gian diễn dịch là tập các tên gọi của đối tượng Kết thúc quá trình nhận dạng ta xác định được tên gọi cho các đối tượng trong tập không gian đối tượng hay nói cách khác là đã nhận dạng được đối tượng Một cách hình thức gọi là tập tên đối tượng:
= {w1, w2, …, wk} với wi, i = 1, 2,…, k là tên của các đối tượng
1.1.2 Mô hình và bản chất của quá trình nhận dạng
1.1.2.1 Mô hình
Việc lựa chọn một quá trình nhận dạng có liên quan mật thiết đến kiểu mô
tả mà người ta sử dụng để đặc tả đối tượng Trong nhận dạng, người ta phân chia làm hai họ lớn:
Trang 10- Họ mô tả theo tham số
- Họ mô tả theo cấu trúc
Cách mô tả được lựa chọn sẽ xác định mô hình của đối tượng Như vậy, chúng
ta sẽ có hai loại mô hình: mô hình theo tham số và mô hình theo cấu trúc
* Mô hình tham số: sử dụng một vectơ để đặc tả đối tượng Mỗi phần tử của
vectơ mô tả một đặc tính của đối tượng Ví dụ trong các đặc trưng chức năng, người ta sử dụng các cơ sở trực giao để biểu diễn Và như vậy, ảnh sẽ được biểu diễn bởi một chuỗi các hàm trực giao Giả sử C là đường bao của ảnh và C(i,j) là điểm thứ i trên đường bao, i = 1, 2,…, N (đường bao gồm N điểm)
1
1
N
N
i
1
1
N
N
i
là tọa độ tâm điểm Như vậy, moment trung tâm bậc p, q của đường bao là:
N
pq i 0 i 0
1
1
N i
Vectơ tham số trong trường hợp này chính là các moment ij với i = 1, 2,…, p
và j = 1, 2,…, q Còn trong số các đặc trưng hình học, người ta sử dụng chu tuyến, đường bao, diện tích và tỷ lệ T = 4S/p2, với S là diện tích, p là chu tuyến
Việc lựa chọn phương pháp biểu diễn sẽ làm đơn giản cách xây dựng Tuy nhiên, việc lựa chọn đặc trưng nào là hoàn toàn phụ thuộc vào ứng dụng
* Mô hình cấu trúc: cách tiếp cận của mô hình này dựa vào việc mô tả đối
tượng nhờ một số khái niệm biểu thị các đối tượng cơ sở trong ngôn ngữ tự nhiên Để mô tả đối tượng, người ta dùng một số dạng nguyên thủy như đoạn thẳng, cung, v.v… Trong mô hình này, người ta sử dụng một bộ ký hiệu kết thúc
sản xuất để mô tả cách xây dựng các đối tượng phù hợp dựa trên các đối tượng
chấp nhận một khẳng định là: cấu trúc một dạng là kết quả của việc áp dụng luật sản xuất theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu Một
Trang 11cách hình thức, ta có thể coi mô hình này tương đương một văn phạm G = (Vt,
Vn, P, S) với:
- Vt là bộ ký hiệu kết thúc,
- Vn là bộ ký hiệu không kết thúc,
- P là luật sản xuất,
- S là dạng (ký hiệu bắt đầu)
1.1.2.2 Bản chất của quá trình nhận dạng
Quá trình nhận dạng gồm 3 giai đoạn chính:
- Lựa chọn mô hình biểu diễn đối tượng
- Lựa chọn luật ra quyết định (phương pháp nhận dạng) và suy diễn quá trình học
- Học nhận dạng
Khi mô hình biểu diễn đối tượng đã được xác định, có thể là định lượng (mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển sang giai đoạn học Học là giai đoạn rất quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tượng thành các lớp
Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đối tượng vào một lớp hay nói cách khác gán cho đối tượng một tên
Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống nhận dạng có thể tóm tắt theo sơ đồ sau:
Hình 1.1 Sơ đồ tổng quát một hệ nhận dạng 1.1.3 Bài toán nhận dạng đối tượng ảnh
Cho trước các đối tượng hai chiều Tồn tại nhiều bài toán nhận dạng khác nhau đối với các đối tượng ảnh hai chiều
Trích chọn đặc trưng
biểu diễn đối tượng
Phân lớp
trả lời
Trang 12TÀI LIỆU THAM KHẢO
Tiếng Việt
Bách khoa Hà Nội
Tiếng Anh
correspondences International Journal of Computer Vision, 25(2):145- 166
views In Conference on Computer Vision and Pattern Recognition, Hilton
Head, South Carolina, pp 774-781
[4] Brown, M and Lowe, D.G 2002 Invariant features from interest point
groups In The 13th British Machine Vision Conference, Cardiff
University, UK, pp 253–262
In Alvey Vision Conference, pages 147–152
at different scales Journal of Applied Statistics, 21(2):224-270
In International Conference on Computer Vision, Corfu, Greece, pp 1150-1157
keypoints International Journal of Computer Vision
transformations, Ph.D thesis, Institut National Polytechnique de
Grenoble, France
[10] Mikolajczyk, K., and Schmid, C 2004 Scale & affine invariant interest
point detectors International Journal of Computer Vision 60(1), 63-86
Trang 13[11] Mikolajczyk, K and Schmid, C 2005 A performance evaluation of local
descriptors In IEEE Transactions on Pattern Analysis and Machine
Intelligence
[12] Rothganger, F., Lazebnik, S., Schmid, C and Ponce J 2005 Object
modeling and recognition using local affine-invariant image descriptors and multi-view spatial consraints In International Journal of Computer Vision
[13] http://en.wikipedia.org/wiki/Fixed-point_theorem
[14] http://signal.ece.utexas.edu/seminars/dsp_seminars/02spring/danilo.html [15] http://www.hindawi.com/journals/fpta/guidelines.html
[16] http://www.icassp2003.com/archives/5
Trang 14MỤC LỤC
CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT 2
DANH MỤC CÁC HÌNH VẼ 3
MỞ ĐẦU 4
Chương 1 TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG 6
ĐỐI TƯỢNG 6
1.1 Tổng quan về nhận dạng 6
1.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch 7
1.1.1.1 Không gian biểu diễn đối tượng 7
1.1.1.2 Không gian diễn dịch 7
1.1.2 Mô hình và bản chất của quá trình nhận dạng 7
1.1.2.1 Mô hình 7
1.1.2.2 Bản chất của quá trình nhận dạng 9
1.1.3 Bài toán nhận dạng đối tượng ảnh 9
1.2 Tổng quan về bất biến và vai trò của bất biến trong nhận dạng Error! Bookmark not defined
1.2.1 Bất biến moment thống kê Error! Bookmark not defined
1.2.2 Bất biến hình học Error! Bookmark not defined
1.2.3 Bất biến đại số Error! Bookmark not defined
1.2.4 Vai trò của bất biến trong nhận dạng Error! Bookmark not defined
1.3 Điểm bất động và vai trò của điểm bất động trong nhận dạng Error! Bookmark not defined
1.3.1 Lý thuyết điểm bất động Error! Bookmark not defined
1.3.2 Vai trò của điểm bất động trong nhận dạng đối tượng Error! Bookmark not defined
1.3.2.1 Trích chọn các đặc trưng bất biến từ các điểm bất động
Error! Bookmark not defined
1.3.2.2 So khớp đặc trưng Error! Bookmark not defined Chương 2 CÁC PHƯƠNG PHÁP XÁC ĐỊNH ĐIỂM BẤT ĐỘNG Error!
Bookmark not defined
Trang 15TRONG ẢNH Error! Bookmark not defined
2.1 Phương pháp Harris Error! Bookmark not defined
2.2 Phương pháp Harris-Laplace Error! Bookmark not defined
2.2.1 Sự thể hiện không gian tỷ lệ Error! Bookmark not defined
2.2.2 Hàm Harris thích nghi tỷ lệ Error! Bookmark not defined
2.2.3 Sự lựa chọn tỷ lệ tự động Error! Bookmark not defined
2.2.3 Thuật toán phát hiện điểm bất biến Harris-LaplaceError! Bookmark not defined
2.2.3.1 Thuật toán Harris-Laplace Error! Bookmark not defined
2.2.3.2 Thuật toán Harris-Laplace đơn giản Error! Bookmark not defined
2.2.3.3 Ví dụ về các điểm bất biến Error! Bookmark not defined
defined
2.3.1 Động cơ thúc đẩy Error! Bookmark not defined
2.3.2 Ma trận moment cấp hai affine Error! Bookmark not defined
2.3.2.1 Phép biến đổi affine của ma trận moment cấp hai Error! Bookmark not defined
2.3.2.2 Phép đo tính đẳng hướng Error! Bookmark not defined
2.3.3 Phương pháp phát hiện điểm bất biến Harris-Affine Error! Bookmark not defined
2.4 Phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” Error! Bookmark not defined
2.4.1 Phát hiện cực trị không gian tỷ lệ Error! Bookmark not defined
2.4.1.1 Tần số lấy mẫu theo tỷ lệ Error! Bookmark not defined
2.4.1.2 Tần số lấy mẫu trong một vùng không gian Error! Bookmark not defined
2.4.2 Định vị chính xác điểm khóa Error! Bookmark not defined
2.4.3 Gán hướng cho các điểm khóa Error! Bookmark not defined
2.4.4 Bộ mô tả ảnh cục bộ Error! Bookmark not defined
2.5 Kết luận Error! Bookmark not defined Chương 3 ỨNG DỤNG ĐIỂM BẤT ĐỘNG TRONGError! Bookmark not
defined
NHẬN DẠNG ĐỐI TƯỢNG Error! Bookmark not defined