HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM Trịnh Trung Nghĩa LUẬN VĂN THẠC SĨ NGÀNH: HỆ THỐNG THÔNG TIN NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ
Trang 1HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
Trịnh Trung Nghĩa
LUẬN VĂN THẠC SĨ NGÀNH: HỆ THỐNG THÔNG TIN
NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ MÀU MỜ
Hà Nội – tháng 5 năm 2020
Trang 2HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
Trịnh Trung Nghĩa
LUẬN VĂN THẠC SĨ NGÀNH: HỆ THỐNG THÔNG TIN NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ MÀU MỜ
Chuyên ngành: Hệ thống thông tin
Mã số: 8480104 CÁN BỘ HƯỚNG DẪN KHOA HỌC: PGS.TS ĐẶNG VĂN ĐỨC
Hà Nội , 2020
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn với tên đề tài “Nghiên cứu phương pháp tra cứu ảnh theo nội dung sử dụng biểu đồ màu mờ” là kết quả của việc học tập và nghiên cứu của bản thân học viên, thu thập cơ sở dữ liệu thực tiễn dưới sự hướng dẫn khoa học của PGS TS Đặng Văn Đức Các số liệu, kết quả đưa ra tại luận văn này của tôi là hoàn toàn đúng đắn và trung thực, những tài liệu thông tin sử dụng trong luận văn này được trích dẫn và có nguồn gốc rõ ràng, đầy đủ
Hà Nội, Ngày … Tháng … Năm 2020
Người cam đoan
Trịnh Trung Nghĩa
Trang 4đỡ quan trọng trong quá trình thực hiện luận văn
Xin chân thành cảm ơn Ban quản lý Học Viện CNTT cùng toàn thể các Thầy
Cô giáo Viện Công Nghệ Thông Tin - Viện Hàn Lâm Việt Nam đã quan tâm tạo môi trường thuận lợi để cho tôi học tập và nghiên cứu chuyên sâu về lĩnh vực Công nghệ thông tin
Cuối cùng tôi cảm ơn tất cả những sự giúp đỡ của đồng nghiệp, bạn bè đã đóng góp ý kiến, động viên để tôi hoàn thành được luận văn này
Hà Nội, Ngày … Tháng 5 Năm 2020
Học Viên
Trịnh Trung Nghĩa
Trang 5DANH MỤC KÝ HIỆU,CHỮ VIẾT TẮT
STT Từ viết tắt Từ viết đầy đủ Diễn giải
4 CIELAB Commission Internationale
del’Eclairage L-*a-*b color space
Không gian màu đồng nhất CIELAB
space
Không gian màu CMY
Trang 611 IBM International Business
13 L*a*b* L*a*b* color space Không gian màu đồng
16 RGB Red-Green-Blue color space Không gian màu RGB
18 YCbCr
Y-Luma (Brighnesshay Luminance); CbCr – ChromaBlue và Chroma Red color space
Không gian màu YCbCr
-chrominancechannels
Không gian màu YUV
Trang 7DANH MỤC HÌNH ẢNH TRONG LUẬN VĂN
Hình 1.1: Tổng quan kiến trúc về hệ thống tra cứu ảnh
Hình 1.2: Tương quan màu sắc, ánh sáng với Mắt
Hình 1.3: Không gian màu RGB
Hình 1.4: Đặc trưng kết cấu của ảnh
Hình 2.1: Biểu đồ mô tả màu của ảnh
Hình 2.2: Biểu đồ màu của 3 ảnh khác nhau
Hình 2.3 : Công cụ tìm kiếm hình ảnh của Google
Hình 2.4: Phần bù của một tập mờ
Hình 2.5: Độ đo khoảng cách Minkowski
Hình 2.6: Độ đo khoảng cách Quadretic
Hình 2.7: Ảnh và biểu đồ màu của ảnh thử nghiệm
Hình 2.7.1: Tính khoảng cách giữa ảnh A và B sử dụng LCH
Hình 2.7.2: Sơ đồ thủ tục tính toán FCH (n’=163
= 4096) Hình 2.8: Sơ đồ khối hệ thống suy luận mờ
Hình 2.9: Hàm thành viên của L*,a* và b*
Hình 2.10: Hàm thành viên mờ đầu ra của hệ thống
Hình 2.11: Cấu trúc của biểu đồ màu mờ
Hình 2.12: Hệ thống suy luận mờ tạo ra biểu đồ màu mờ
Hình 2.13: Biểu đồ FCH - 1D tạo ra từ hệ thống liên kết mờ của ảnh truy vấn
Hình 3.1 Kiến trúc hệ thống tìm kiếm ảnh theo nội dung ở trong luận văn Hình 3.2 Kiểu dữ liệu struct trong CSDL đặc trưng trong Matlab
Hình 3.2 Biểu đồ chức năng hoạt động của xây dựng CSDL đặc trưng CCH trong không gian màu RGB, HSV
Trang 8Hình 3.3 Biểu đồ chức năng hoạt động, xây dựng CSDL đặc trưng
FCH trong không gian màu L*a*b*
Hình 3.4 Biểu đồ hoạt động chức năng tìm kiếm ảnh trên cơ sở CCH
theo RGB hoặc HSV
Hình 3.6 Giao diện chính của chương trình thử nghiệm
Hình 3.7 Giao diện tìm kiếm và hiển thị ảnh kết quả của chương trình
Hình 3.8 Biểu đồ màu CCH và FCH của ảnh bus 340.jpg và ảnh đã thêm 15% nhiễu gaussian
Hình 3.9 Biểu đồ màu CCH và FCH của ảnh xe bus 340.jpg và
ảnh đã thay đổi độ sáng 15%
Hình 3.10 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với FCH
Hình 3.11 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trongRG Hình 3.12 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trong HSV Bảng 3.1 Kết quả thử nghiệm độ chính xác với ảnh xe bus và một số ảnh khác nhau , đã tạo thêm 15% độ nhiễu Gausian và thay đổi độ sáng 15%
Bảng 3.2 Một số kết quả thử nghiệm tìm kiếm trong CSDL ảnh WANG
Bảng 3.3 Một số kết quả thử nghiệm từ chương trình tìm kiếm ảnh trên
CSDL ảnh y tế
Trang 9MỤC LỤC
LỜI CAM ĐOAN 1
LỜI CẢM ƠN 2
DANH MỤC HÌNH ẢNH TRONG LUẬN VĂN 5
MỤC LỤC 7
PHẦN MỞ ĐẦU 10
CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG 12 1.1 Hệ thống tra cứu ảnh theo nội dung và những thành phần chính của nó 15
1.2 Các đặc trưng trong hệ thống tìm kiếm ảnh dựa trên nội dung 16
1.2.1 Đặc trưng màu sắc 16
Các đặc trưng về hình dạng của ảnh 18
1.2.2 Đặc trưng kết cấu 20
1.2.3 Biểu đồ màu 21
1.3 Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung 24
1.3.1 Công cụ tìm kiếm Google Image Search 25
1.3.2 Hệ thống QBIC (Query By ImageContent) 26
1.3.3 Hệ thống WebSEEK và VisualSEEK 26
1.4 Tổng quan về Logic mờ 27
1.4.1 Giới thiệu chung về Logic mờ 27
1.4.2 Khái niệm tập hợp mờ 29
1.4.3 Các đặc trưng của tập mờ 29
1.4.4 Các phép toán trên tập mờ 30
1.5 Kết luận chương 34
Trang 10CHƯƠNG 2 TÌM KIẾM ẢNH THEO NỘI DUNG TRÊN CƠ SỞ
BIỀU ĐỒ MÀU MỜ 35
2.1 Đo khoảng cách giữa các biểu đồ màu 35
2.1.1 Độ đo khoảng cách Minkowski(L p ) 36
2.1.2 Độ đo khoảng cách toàn phương(Quaratic) 37
2.1.3 Độ đo khoảng cách biểu đồ giao nhau (Histogram Intersection Distance) 39
2.2 Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu thông thường 39
2.2.1 Biểu đồ màu toàn bộ (Global Color Histogram) 39
2.2.2 Biểu đồ màu cục bộ ( LCH ) 41
2.3 Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu mờ 43
2.3.1 Định nghĩa biểu đồ màu mờ(FCH) 43
2.3.2 Tính toán FCH và độ đo khoảng cách 43
2.3.3 Tính toán FCH trong không gian màu CIELAB sử dụng thuật toán phân cụm mờ 44
2.3.4 Phương pháp tạo biểu đồ màu dựa vào hệ thống liên kết mờ trong không gian màu L*a*b* 47
2.4 Tổng kết chương 54
CHƯƠNG 3 THỬ NGHIỆM 55
3.1 Giới thiệu bài toán thử nghiệm 55
3.2 Dữ liệu thử nghiệm 55
3.3 Mô tả hệ thống thử nghiệm 56
3.3.1 Xây dựng CSDL đặc trưng 56
3.3.2 Chức năng tìm kiếm ảnh 56
3.4 Môi trường và công cụ sử dụng xây dựng thử nghiệm 57
Trang 113.5 Thiết kế chương trình thử nghiệm 58
3.5.1 Xây dựng CSDL đặc trưng - Thiết kế CSDL đặc trưng 59
3.5.2 Thiết kế giao diện của chương trình thử nghiệm 63
3.6 Đánh giá kết quả thử nghiệm 64
3.6.1 Đo lường hiệu suất trong hệ thống tìm kiếm ảnh 64
3.6.2 Kết quả thử nghiệm 65
CHƯƠNG 4 KẾT LUẬN 78
TÀI LIỆU THAM KHẢO 80
PHỤ LỤC 1 82
Trang 12PHẦN MỞ ĐẦU
Ngày nay với sự phát triển của của các phương tiện truyền thông, các phương tiện lưu trữ hình ảnh, cùng kích thước của các tập ảnh số được gia tăng một cách chóng mặt Thì việc tìm kiếm ảnh và lưu trữ ảnh sao cho nhanh chóng và hiệu quả là rất cần thiết với người dùng Việc tra cứu ảnh là nhu cầu rất cần thiết từ nhiều lĩnh vực khác nhau như: trinh sát, dự báo thời tiết, phòng chống tội phạm… Cùng chung mục đích này, rất nhiều các chương trình thiết
kế để tìm kiếm ảnh đã được xây dựng và ứng dụng trong thực tế Trong đó có hai nền tảng chính là: dựa trên văn bản (text-based) và dựa trên nội dung (content-based)
Các phương pháp tiếp cận trong những năm 1970 dựa trên văn bản được sử dụng nhiều Tại thời điểm đó các bức ảnh được con người chú thích bằng văn bản một cách thủ công , sau đó được lưu trữ bởi các hệ thống quản
lý cơ sở dữ liệu, và đưa vào thực hiện việc tra cứu ảnh Khi đó người ta nhận
ra một số nhược điểm của phương pháp này đó là:
Thứ nhất: Nó cần quá nhiều công sức lao động của con người để tạo chú thích cho những bức ảnh
Thứ hai là: nếu việc đánh chú thích không chuẩn do nhận thức chủ quan của mỗi người là khác nhau
Để khắc phục hai nhược điểm trên của hệ thống tra cứu ảnh dựa trên văn bản, khái niệm tra cứu ảnh dựa trên nội dung được giới thiệu vào đầu năm
1980
Với Luận văn này sẽ thể hiện một số kỹ thuật dựa trên phản hồi liên quan, được ứng dụng trong công nghệ tra cứu ảnh theo nội dung Để cải thiện hiệu năng tra cứu, thu hẹp khoảng cách về ngữ nghĩa Luận văn được chia làm 3 chương cụ thể như sau:
Chương 1: Các khái niệm chung về tra cứu ảnh dựa trên nội dung
Giới thiệu các kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung, các đặc trưng sử dụng trong tìm kiếm ảnh theo nội dung, khả năng ứng dụng và khái quát về Logic mờ
Trang 13Chương 2: Đo khoảng cách giữa các biểu đồ màu, Tìm kiếm ảnh theo
nội dung dựa trên cơ sở biểu đồ màu thông thường, Tìm kiếm ảnh theo nội dung trên cơ sở biều đồ màu mờ
Chương 3: Áp dụng cài đặt chương trình thử nghiệm
Cài đặt chương trình tìm kiếm ảnh, thử nghiệm trên Matlab dựa theo kiến thức và lý thuyết từ các chương của luận văn
Trang 14CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH
THEO NỘI DUNG Giới thiệu:
Hiện nay với việc bùng nổ về hệ thống thông tin thì việc tìm kiếm thông tin dữ liệu có vai trò quan trọng, trong đó việc tìm kiếm ảnh cũng đang trở nên cần thiết Truy xuất thông tin hình ảnh dựa trên nội dung, hoặc truy xuất hình ảnh dựa trên nội dung là một trong những lĩnh vực nghiên cứu mạnh mẽ nhất trong lĩnh vực máy tính trong hơn 10 năm qua Sự sẵn có của
số lượng lớn dữ liệu trực quan và đa phương tiện đang phát triển, và sự phát triển của Internet nhấn mạnh đến các nhu cầu để tạo ra các phương thức truy cập theo chủ đề, cung cấp nhiều hơn các truy vấn hoặc yêu cầu dựa trên văn bản đơn giản, dựa trên các trường cơ sở dữ liệu chính xác
Có nhiều chương trình và công cụ đã được phát triển để hình thành và thực hiện các truy vấn dựa trên nội dung hình ảnh hoặc âm thanh, để giúp chạy duyệt các kho dữ liệu đa phương tiện lớn Tuy nhiên, không có bước đột phá chung nào đạt được đối với các cơ sở dữ liệu lớn khác nhau với các tài liệu thuộc các loại khác nhau về đặc điểm và nội dung Một số câu trả lời cho nhiều câu hỏi liên quan đến tốc độ, mô tả ngữ nghĩa hoặc giải thích hình ảnh khách quan vẫn chưa được trả lời
Để tìm kiếm ảnh hiện nay có hai cách: một là phương pháp tìm kiếm theo từ khoá và hai là tìm kiếm theo nội dung ảnh Phương pháp thứ nhất là tìm kiếm ảnh theo từ khoá phương pháp này người dùng khá ưa thích vì tính chất đơn giản và dễ thao tác Cùng với đó việc tìm kiếm ảnh dựa theo
từ khoá thì nhanh hơn so với tìm kiếm theo nội dung bởi vì tìm kiếm theo từ khóa hoạt động trên việc so sánh và phân tích các từ hay cụm từ khi xác định chúng giống với nhau thì đưa ra kết quả gần đúng nhất Do kiểu dữ liệu đầu vào là dạng văn bản nên việc tìm kiếm và xuất kết quả thực hiện một cách nhanh chóng, và không đòi hỏi người tìm kiếm phải chuẩn bị ảnh mẫu trước Bên cạnh đó việc tìm kiếm theo phương pháp này còn có một số hạn chế đó là kết quả tìm kiếm khi trả về đôi khi không đúng ý định ban đầu của người dùng
Trang 15Để khắc phục các hạn chế trên thì phương pháp tìm kiếm ảnh dựa trên nội dung được ra đời để khắc phục những hạn chế này Tư tưởng chính của phương pháp tìm kiếm ảnh này là người ta tự động trực tiếp gắn mô tả cho những bức ảnh, phân tích nội dung ảnh mà không có sự can thiệp thủ công Điểm nổi bật của thuật toán này so với thuật toán tìm kiếm ảnh dựa trên từ khóa đó là nội dung của ảnh luôn luôn nhất quán và ở phần trích chọn đặc trưng của ảnh được thực hiện một cách tự động Trên thực tế, người sử dụng luôn thích dùng các từ khóa, để mô tả văn bản và giải thích cho hình ảnh của họ và đo độ tương tự Trên một khía cạnh nào đó những đặc trưng này được trích chọn tự động bằng việc sử dụng các kỹ thuật của thị giác máy và chủ yếu là các đặc trưng ở mức thấp như đặc trưng về hình dạng, đặc trưng về màu sắc ảnh, đặc trưng về kết cấu, …) Cho dù đã có nhiều thuật toán được đầu tư về kỹ thuật để mô tả các đặc trưng của ảnh như màu sắc, hình dạng nhưng vẫn không thể phản ánh hết các ngữ nghĩa của ảnh Phân tích nội dung đa phương tiện được áp dụng trong các ứng dụng thị giác máy tính trong thế giới thực khác nhau và hình ảnh kỹ thuật số là một phần chính của dữ liệu đa phương tiện Trong vài năm qua, sự phức tạp của nội dung đa phương tiện, đặc biệt là hình ảnh đã tăng theo cấp số nhân và trên cơ sở hàng ngày, hơn hàng triệu hình ảnh được tải lên tại các kho lưu trữ khác nhau như Twitter, Facebook và Instagram Để tìm kiếm một hình ảnh có liên quan từ một kho lưu trữ là một vấn đề nghiên cứu đầy thách thức cho cộng đồng nghiên cứu tầm nhìn máy tính Hầu hết các công cụ tìm kiếm lấy hình ảnh trên cơ sở các cách tiếp cận dựa trên văn bản truyền thống dựa trên chú thích và siêu dữ liệu Trong thập kỷ qua , nghiên cứu sâu rộng được báo cáo để tìm kiếm , ảnh dựa trên nội dung (CBIR) , phân loại hình ảnh và phân tích
Các khái niệm quan trọng và nghiên cứu chính dựa trên CBIR và biểu diễn hình ảnh sẽ được thảo luận chi tiết và các hướng nghiên cứu trong tương lai được kết luận và tạo điều kiện cho nghiễn cứu tiếp theo trong lĩnh vực này
Kỹ thuật tìm kiếm ảnh dựa trên nội dung (CBIR) đã được đưa vào như
Trang 16một câu trả lời cho những khó khăn của cách tiếp cận dựa trên văn bản Kỹ thuật CBIR vượt qua rào cản đại diện cho một hình ảnh mang tính văn bản Trong các hệ thống CBIR , thuật toán xử lý hình ảnh được sử dụng và các vector đặc trưng được trích xuất tự động Các tính năng của hình ảnh là màu sắc, kết cấu và hình dạng Các vecto đặc trưng đại diện cho các tính năng này
Ưu điểm của CBIR :
- Quá trình thu hồi được xử lý một cách tự động
- Xử lý truy vấn cũng phụ thuộc vào diễn giải trực quan
Do vậy, các khái niệm đặc trưng mức cao và các đặc trưng
mức thấp vẫn còn nhiều nên hiệu suất của CBIR là vẫn còn
tương đối lớn với mong muốn của người sử dụng
Trang 171.1 Hệ thống tra cứu ảnh theo nội dung và những thành phần chính của nó
Một hệ thống tra cứu ảnh theo nội dung cần các thành phần sau:
Hình 1-1: Tổng quan về kiến trúc của hệ thống tra cứu ảnh
Trong một hệ thống tra cứu ảnh theo nội dung có ba thành phần quan trọng nhất đó là: Giao diện truy vấn cho người dùng, đánh chỉ số và trích chọn đặc trưng
Trang 181.2 Các đặc trƣng trong hệ thống tìm kiếm ảnh dựa trên nội dung
CBIR đề cập đến nội dung hình ảnh được lấy trực tiếp, qua đó các hình ảnh có tính năng nhất định hoặc chứa nội dung nhất định sẽ được tìm kiếm trong cơ sở dữ liệu hình ảnh Ý tưởng chính của CBIR là phân tích thông tin hình ảnh bằng các tính năng cấp thấp của hình ảnh, bao gồm: màu sắc, kết cấu, hình dạng và mối quan hệ không gian của các đối tượng, v.v và thiết lập các vector đặc trưng của hình ảnh làm chỉ mục Phương pháp truy xuất tập trung tính toán mức độ tương đồng giữa véc tơ đặc trưng đa chiều ảnh đầu vào và các véc tơ đặc trưng đa chiều trong CSDL
1.2.1 Đặc trƣng màu sắc
Hiện nay việc sử dụng đặc trưng màu sắc của ảnh trong tìm kiếm ảnh được sử dụng rất nhiều, đặc biệt trong lĩnh vực tra cứu ảnh dựa theo nội dung.Vì ta thấy được rằng trong một bức ảnh màu thì dữ liệu quan trọng nhất của nó là màu sắc Mặt khác, màu sắc có những đặc điểm rất dễ trong việc đánh chỉ số
và có tính trực quan, trích chọn theo thông tin màu của ảnh sau đó đưa ra những phân tích và tìm kiếm ảnh đã có hiệu quả thông qua biểu đồ màu
Có nhiều định nghĩa về màu, từ góc nhìn khoa học: Màu là phân bổ bước sóng λ (red: 700nm, violet: 400nm) hay tần số f của sóng điện từ.Từ quá trình
xử lý thị giác: Màu là thuộc tính quan sát vật thể, kết quả từ việc vật thể phát
ra, truyền hay phản xạ ánh sáng đến mắt người
Trang 19H1.2 Tương quan màu sắc, ánh sáng với Mắt
Trong tra cứu ảnh việc sử dụng dặc trưng màu sắc được sử dụng phổ biến Trên một không gian màu thì các màu sắc được định nghĩa cụ thể Sự
đa dạng của không gian màu là có sẵn, rất nhiều ứng dụng hiện nay đều đang sử dụng, khai thác các đặc trưng của ảnh
Các vấn đề chính trong khai thác đặc trưng màu bao gồm không gian màu, và lựa chọn chức năng tương tự Các nghiên cứu khác nhau
về nhận thức màu sắc và không gian màu đã được đề xuất Có thể hiểu rằng không gian màu là mô hình toán học trừu tượng dùng để mô tả cách biểu diễn màu mà con người có thể nhận biết bởi bộ các chữ số (có giá trị )hay bởi các thành phần màu.Tại mỗi điểm ảnh trên một bức ảnh nào đó ta có thể biểu diễn được bằng một điểm trong một không gian màu 3 chiều
Trang 20Hình 1.3 Không gian màu RGB
RGB là không gian màu được sử dụng nhiều nhất hiện nay để hiển thị ảnh, RBG bao gồm 3 thành phần màu cụ thể là: màu đỏ, màu xanh lá và màu xanh lam Không gian RGB là một dạng của mô hình cộng bởi vì các màu sắc trong không gian này có thể cộng lại với nhau tạo ra một màu sắc cụ thể nào đó
Cách biểu diễn một màu tùy ý trong dãy hiển thị được thực hiện bằng cách tổ hợp ba màu Đỏ, Xanh lá và Xanh Lam với nhau, gán giá trị từ 0 đến 1 cho R(1,0,0), G(0,1,0), B(0,0,1) Ví dụ: Red (1,0,0) + Blue (0,0,1)
→Magenta (1,0,1) Đường chéo từ (0,0,0) đến ( 1,1, 1 ) biểu diễn màu xám Tuy nhiên không gian màu RGB không thể biểu diễn mọi màu trong phổ nhìn thấy
Các đặc trƣng về hình dạng của ảnh
Khi ta so sánh đặc trưng về hình dạng với các đặc trưng về màu sắc hay đặc trưng về kết cấu thì các đặc trưng của hình dạng thường chỉ được sử dụng sau khi ảnh đã phân tách thành các vùng hoặc các đối tượng ảnh Bởi
Trang 21vì khi ta tách đối tượng ảnh cùng phân vùng rất khó có thể thu được kết quả tốt chính vì thế việc sử dụng các đặc điểm hình dạng của ảnh để tìm kiếm ảnh thường bị bó hẹp trong một vài ứng dụng mà ở đó các vùng ảnh hoặc đối tượng ảnh đã được tách biệt rõ ràng
Có 2 loại trích chọ đặc trưng cơ bản đó là: trích chọn dựa theo đường biên và trích chọn dựa theo vùng của ảnh
Khi thực hiện phép toán trích chọn đặc trưng của ảnh người ta thường tách đối tượng ra khỏi ảnh VD “bức ảnh cô gái đứng trên bãi biển “ thì trước tiên người ta tách đối tượng ra khỏi ảnh tức là sẽ phải tách hình “cô gái ” ra khỏi nền của bức ảnh ( nền là cảnh bãi biển )
Hình 1.4: Đặc trưng về hình dạng
Cách biểu diễn theo đường viền bao quanh chỉ sử dụng đường biên bên ngoài của hình dạng, để làm được điều này người ta sử dụng cách mô tả vùng đang quan tâm bằng cách đặc tính bên ngoài của nó, có nghĩa là các điểm ảnh dọc theo đường viền bao quanh đối tượng ảnh Cách biểu diễn theo vùng là cách sử dụng cả vùng ảnh bằng cách mô tả vùng đang quan tâm bằng các đặc tính bên trong tức là các điểm ảnh ở bên trong vùng đó
Trang 221.2.2 Đặc trƣng kết cấu
Trong các đặc trưng của ảnh thì đặc trưng “kết cấu” là một đặc trưng có tầm ảnh hưởng lớn nhất và cần thiết nhất Đặc trưng kết cấu có ảnh hưởng rất lớn đến sự nhận thức trực quan của người dùng khi họ nhìn vào nó Các vùng của ảnh được nó cung cấp bản mẫu trực quan Đặc trưng kết cấu gồm các thuộc tính như: Thuộc tính thô, độ tương phản, hướng, chu kỳ, tính ngẫu nhiên và tính quy luật
Hình 1.4: Đặc trưng kết cấu của ảnh Khác với đặc trưng hình dạng, đặc trưng kết cấu thể hiện trên một vùng chứ không phải tại một điểm ảnh và thường được định nghĩa bằng các mức xám
Rất nhiều nghiên cứu trong các lĩnh vực như nhận dạng và thị giác máy tính nó thể hiện được đặc trưng kết cấu của hình ảnh Nhìn nhận một cách chủ quan thì có 2 cách biểu diễn kết cấu đó là: phương pháp thống kê và Phương pháp cấu trúc
Các phương pháp cấu trúc bao gồm các đồ thị liền kề và toán tử hình thái,
mô tả kết cấu bằng cách định nghĩa các nguyên thuỷ cấu trúc và luật sắp
Trang 23đặt của chúng Các phương pháp cho thấy hiệu quả rõ rệt khi áp dụng trong trường hợp kết cấu thông thường
Một số phương pháp thống kê gồm các phương pháp: Phương pháp ma trận đồng khả năng, phổ năng lượng Fourier, Tamura, Phân tích Wold, trường ngẫu nhiên Markov, Không gian fractal ,các bộ lọc đa phân giải như biến đổi Gabor và biến đổi dạng sóng thể hiện kết cấu bằng sự phân
bố thống kê của độ sáng của các điểm ảnh
1.2.3 Biểu đồ màu
Biểu đồ màu của một bức ảnh thể hiện được sự đặc trưng trong bố cục màu sắc của ảnh đó, các biểu đồ như này là một bảng sơ đồ về màu sắc của ảnh nào đó Công việc tính toán dựa trên biểu đồ màu của ảnh được tiến hành rất nhanh chóng, nó chỉ cần duyệt qua một lần toàn bộ ảnh Vì thế việc sử dụng biểu đồ màu trong việc tìm kiếm ảnh sẽ đem lại cho chúng ta kết quả rất khả quan về phương diện tốc độ tìm kiếm
Hình 2.1: Biểu đồ mô tả màu của ảnh
Biểu đồ màu là đặc trưng rất quan trọng của ảnh và nó thường được ứng dụng trong các hệ thống tìm kiếm ảnh theo nội dung Ở chương 2, luận văn này trình bày cụ thể về phương pháp tìm kiếm ảnh theo nội dung dựa trên biểu đồ màu mờ và biểu đồ màu thông thường Các phương pháp đưa ra đều có tính cải thiện độ chính xác cũng như tốc độ tìm kiếm ảnh
Trang 241.2.3.1 Biểu đồ màu toàn cục (Global Color Histogram)
Biểu đồ màu toàn cục có tên tiếng anh là: Global Color Histogram,
đây là dạng biểu đồ mô tả sự bố trí của màu sử dụng trong tập các màu Để
sử dụng biểu đồ màu toàn cục này thì trước tiên bức ảnh sẽ phải mã hóa với biểu đồ màu của nó và khoảng cách giữa hai ảnh sẽ được xác định bởi khoảng cách giữa các biểu đồ màu của chúng Với phương pháp này ta có thể sử dụng các thước đo khoảng cách để tính toán khoảng cách giữa các biểu đồ màu với nhau
Biểu đồ mầu toàn cục là sự thể hiện sự phân bố màu sắc trong một hình ảnh Biểu đồ màu đại diện cho hình ảnh nhưng từ một góc nhìn khác Biểu đồ màu đếm các pixel tương tự và lưu trữ nó trong các bins để mô tả số lượng pixel trong mỗi phạm vi màu một cách độc lập Biểu đồ màu là một
mô tả màu và như chúng ta đã biết răng mỗi mô tả chứa một thuật toán trích xuất tính năng và một chức năng phù hợp
Tham khảo ví dụ mô tả hoạt động của biểu đồ màu này:
Cho một biểu đồ với 3 màu : Đen, Trắng và Vàng Ta kí hiệu biểu đồ
Trang 25Trong trường hợp nếu hai ảnh khách nhau nhưng có biểu đồ toàn cục giống nhau ví dụ trên ( ảnh B và C ) Thì nó cho ta thấy rõ ràng điểm cực kỳ hạn chế của biểu đồ màu toàn cục
● ảnh A:{25%, 25%, 50%};
● ảnh B: {18.75%, 37.5%, 43.75%};
● ảnh C: {18.75%, 37.5%, 43.75%}
Hình 2.2 :Biểu đồ màu của 3 ảnh khác nhau
1.2.3.2 Biểu đồ màu tương quan (Color Correlogram Histogram)
Biểu đồ màu tương quan được phát triển để khắc phục những vấn đề
mà trong không gian màu, mà thông qua lược đồ ta thấy được những thông tin về màu sắc còn thiếu sót Lược đồ màu này không những có thể biểu diễn sự phân phối màu của các điểm ảnh mà nó còn là thể hiện sự tương quan về không gian giữa các cặp màu do lược đồ chỉ chú ý tới sự tương quan về không gian, giống nhau giữa những màu do vậy chi phí tính toán và
số chiều được giảm đi đáng kể
Biểu đồ tương quan màu sắc được đề xuất để mô tả không chỉ thể hiện sự phân chia màu sắc của pixel mà còn cả tương quan không gian của các cặp màu Kích thước thứ nhất và thứ của biểu đồ ba chiều là màu sắc của bất kỳ cặp pixel nào và chiều thứ ba là khoảng cách không gian của chúng Biểu đồ tương quan màu là bảng được lập chỉ mục bởi các cặp màu
Cho một tương quan màu với các chỉ số đánh theo bảng bởi các cặp
Trang 26màu Với mỗi pixel có màu i trong ảnh, là xác suất tìm thấy một pixel có màu j các pixel ban đầu một khoảng cách k Cho I biểu diễn toàn bộ tập các pixel ảnh và Ic(i) biểu diễn tập các pixel có màu C(i) thì tương quan màu được định nghĩa bằng:
Trong đó: p2 ЄI, p1 Є Ic(i)
k Є {1,2,…,d}
i, j Є {1,2,…,N}
|p1-p2| là khoảng cách giữa các pixel p1
và p2 Kích thước của Correlogram là
O(N2d)
Khi chọn d để tính Correlogram ta cần chú ý vấn đề sau:
Giá trị d lớn thì cần nhiều chi phí tính toán và không gian lưu
trữ
Giá trị d nhỏ có thể giảm giá trị lưu trữ của đặc trưng
Khi đem vector liên kết màu với lược đồ màu hay tương quan màu người ta nhận thấy kết tìm kiếm tốt hơn, nhưng mặt khác vì nó có chiều cao lớn hơn nên chi phí tính toán cũng lớn hơn
Kết luận: Tương quan màu sắc không những chỉ thể hiện sự tương quan không gian của các cặp màu, mà nó còn mô tả sự phân bố màu sắc của các pixel
1.3 Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung
Hiện nay việc tra cứu ảnh được sử dụng trong rất nhiều ngành nghề lĩnh vực khác nhau như :
− Ứng dụng trong Quân đội
− Hỗ chợ chuẩn đoán trong y học
− Quản lý tài sản trí tuệ
Trang 27− Ứng dụng trong dư báo thời tiết
− Thiết kế chi tiết máy
− Thiết kế nội thất và xây dựng
− Báo chí quảng cáo
− Giải trí
Một số hệ thống tra cứu ảnh dựa trên nội dung phổ biến hiện nay
Trong những năm gần đây, có rất nhiều hệ thống tra cứu ảnh được phát triển ra đời, Các chương trình tra cứu ảnh dựa theo nội dung được xây dựng cẩn thận bằng cách sử dụng chi tiết số liệu thống kê, logic mờ, nhận dạng khuôn mẫu, máy tính ,tính toán mềm và xử lý các dữ liệu Cùng với đó các chương trình nghiên cứu và ứng dụng thương mại đã được xây dựng một cách bài bản và quy mô Sau đây học viên sẽ giới thiệu một số hệ thống của tra cứu ảnh phổ biến hiện nay mà hầu như mọi người đều biết
1.3.1 Công cụ tìm kiếm Google Image Search
Một công cụ tìm kiếm mà hầu hết mọi người khi sử dụng internet đều biết đến đó là Google, trong các chương trình tìm kiếm của google thì google ảnh là một trong những thành công to lớn của họ, nó giúp người dùng tra cứu ảnh theo nôi dung hay bằng chính những hình ản sẵn có và trả
về kết quả khá chính xác Google Image Search hỗ trợ một số thuộc tính cơ bản như kích thước, hình dạng,… để người dùng tra cứu chuẩn xác hơn
Trang 28Hình 2.3 : Công cụ tìm kiếm ảnh của Google
1.3.2 Hệ thống QBIC (Query By ImageContent)
IBM một tập đoàn công nghệ máy tính đa quốc gia có trụ sở tại Armonk, New York, Mỹ đã phát triển và đưa ra một hệ thống có tên gọi là Query By Image Content ( QBIC ) đó một hệ thống tìm kiếm ảnh thương mại được nhiều người biết đến trong số các hệ thống tra cứu ảnh dựa trên nội dung đã từng phát triển Nó cho phép truy vấn các CSDL hình ảnh lớn bằng các thuộc tính trực quan ví dụ như: tỉ lệ màu sắc, màu sắc hay hình dạng, kết cấu, và từ các bức vẽ phác hoạ,cũng như các từ khóa
Thông thường bất kỳ thuộc tính trực quan nào cũng có thể được
sử dụng trong truy vấn Nhưng khi các thuộc tính trực quan đó có thể kết hợp với từ khoá để tạo thành một truy vấn tổng hợp sẽ cải tiến hiệu quả truy vấn Phần mềm QBIC và trình diễn có tại
http://www.qbic.almaden.ibm.com[3]
1.3.3 Hệ thống WebSEEK và VisualSEEK
WebSEEK là một trong những hệ thống nguyên mẫu truy vấn
Trang 29trực quan dựa trên nội dung được phát triển bởi Đại học Columbia Nó được thiết kế đặc biệt để tìm kiếm hình ảnh và video trên WWW Trong Web SEEK, các hình ảnh được phân tích trong hai quy trình tự động riêng biệt
- Quy trình đầu tiên là trích chọn và lập chỉ mục các đặc trưng trực quan như biểu đồ màu và kết cấu
- Quy trình thứ hai là phân tích văn bản liên quan và phân loại hình ảnh thành các lớp chủ đề theo một phân loại hình ảnh tùy chỉnh Có trên 2000 lớp hình ảnh trong hệ thống phân loại Ví dụ như các lớp chủ đề về thể thao, du lịch, cây cối và các lớp con của chúng
Một mẫu thử nghiệm nâng cao được gọi là Visual SEEK cũng được phát triển Visual SEEK tăng cường khả năng tìm kiếm bằng cách tích hợp các truy vấn không gian (như những người sử dụng trong GIS) và các truy vấn đặc trưng trực quan hình ảnh Người dùng yêu cầu hệ thống tìm kiếm ảnh bao gồm các vùng có các đặc trưng phù hợp và mối quan hệ không gian Web SEEK có thể được truy cập từ
1.4 Tổng quan về Logic mờ
1.4.1 Giới thiệu chung về Logic mờ
Askar Zadeh phát triển lên từ lý thuyết tập mờ từ 1965 ông đã cho ra đời hàng loạt các lý thuyết về tập mờ và được đăng trên báo và các tạp
chí lớn tại Mỹ như “Information and Control” bài báo của ông đã mở
đường cho hàng loạt của những nghiên cứu sau này, áp dụng phương pháp lập luận một cách tương đối thay vì lập luận chính xác theo các
cho phép chúng ta có thể khái quát hóa giá trị của các mệnh đề mờ, vì
Trang 30thế mà ta có thể làm cho thiết bị máy móc hiểu được các thông tin mà ta truyền vào qua các ngôn ngữ tự nhiên,và một điều tuyệt vời là chúng có thể “hiểu” khá chính xác những nội dung mà ta truyển vào Logic mờ đang được sử dụng trong nhiều ứng dụng liên quan đến nhận dạng, xử
lý hình ảnh, xử lý ngôn ngữ, điểu khiển tự động, truy vấn bằng nội dung hình ảnh, phát hiện ranh rới, theo dõi đối tượng
Logic mờ là một công cụ tính toán dùng để sử dụng những kiến thức của con người vào các thuật toán khả thi Ý tưởng về logic mờ được giới thiệu bởi tiến sỹ Lofti Zadeh của UC-Berkley vào năm 1960, là một cách thức của mô hình về sự không chắc chắn của ngôn ngữ tự nhiên
Logic mờ đã được áp dụng gần đây trong quá trình kiểm soát, mô hình hóa, ước tính, xác định, dự đoán thị trường chứng khoán, chẩn đoán, khoa học, quân sự, nông nghiệp , và nhiều lĩnh vực khác Một trong những ứng dụng tiên phong trong logic mờ là trong các hệ thống điều khiển
Điều khiển dựa trên logic mờ được sử dụng trong các ứng dụng khác nhau Suốt trong nhiều năm qua, kiểm soát dựa trên logic mờ đã xuất hiện như một trong những các lĩnh vực tích cực và hiệu quả nhất
để nghiên cứu ứng dụng lý thuyết logic mờ, đặc biệt là trong phạm vi rộng của quá trình công nghiệp thiếu dữ liệu định lượng liên quan đến đầu vào - đầu ra
Không thể phủ nhận những thành công và những mặt tích cực mà logic mờ đem lại Logic mờ đã được chấp nhận và sử dụng rộng rãi nhưng bên cạnh
đó nó vẫn bị phê phán bởi những quan điểm bất đồng tại một vài trường phái nghiên cứu khác
Trang 311.4.2 Khái niệm tập hợp mờ
Khái niệm Tập hợp mờ hay còn gọi là “Tập mờ” là mở rộng của khái niệm tập hợp cổ điển, dùng để đáp ứng nhu cầu biểu diễn những tri thức không chính xác
Để hiểu thế nào là logic mờ, trước hết cần hiểu thế nào là tập hợp
mờ (fuzzy set)
- Cho X là một không gian nền
- A là tập mờ hoặc tập con mờ trên không gian nền X khi và chỉ khi A được xác định bởi hàm :
μA được gọi là hàm thuộc hay hàm thành viên (Membership Function) để chỉ phụ thuộc của các phần tử trong tập X vào tập A
Nên μA(x) còn được gọi là mức độ phụ thuộc (membership
degree hoặc degree of membership ) của phần tử x Î X lên tập A
1.4.3 Các đặc trƣng của tập mờ
Các đặc trưng của một tập mờ A trên X, được hiểu là những thông tin để mô tả về các phần tử liên quan đến tập mờ A, những đặc trưng này có thể chỉ rõ sự khác biệt của những tập con cổ điển khác của
X với tập mờ A
Định nghĩa 1.4.3.1
Giá đỡ của tập mờ A (Support) là tập các phần tử có giá trị hàm thuộc lớn hơn 0 trong tập mờ A, được ký hiệu và xác định như sau:
Trang 32supp(A) = {x | x ∈ X | μA(x) > 0}
Định nghĩa 1.4.3.2
Chiều cao của tập mờ A (Hight) là giá trị lớn nhất mà hàm thuộc
có thể lấy trong tập mờ A, được ký hiệu và xác định như sau:
h(A) = sup{μA(x), x ∈ X}
Như vậy, tập mờ A có nhân khác rỗng khi và chỉ khi A là tập mờ chuẩn hóa
1.4.4 Các phép toán trên tập mờ
1.4.4.1 Phép hợp ( U )
Trên tập vũ trụ U cho hai tập mờ A~
và B~ Hợp của hai tập mờ này
là một tập mờ được ký hiệu là mà hàm thuộc của nó được định nghĩa theo điểm như sau :
hay, trong trường hợp U là hữu hạn hay đếm được,
Một cách tổng quát, cho ∈ F(U), i ∈ I, với I là tập chỉ số hữu hạn hay vô hạn nào đó Khi đó, hợp của các tập mờ như vậy, ký hiệu là , được định nghĩa bằng hàm thuộc như sau:
1.4.4.2 Phép giao ∩
Phép giao của A và B được ký hiệu là: A ∩ B
Phép giao sẽ có hàm thuộc một trong các định nghĩa sau:
Trang 33
1.4.4.3 Phép lấy phần bù ~
Cho A là tập mờ trong X có hàm thuộc µA Phần bù ¬A của A trong
X là một tập mờ có hàm thuộc xác định như sau:
𝜇¬A = 1 − 𝜇 , ∀x ∈ X
Hình 2.4: Phần bù của một tập mờ
1.4.4.4 Phép mờ hóa (Fuzzification)
Fuzzification là quá trình chuyển đổi giá trị đầu vào rõ nét thành giá trị
mờ được thực hiện bằng cách sử dụng thông tin trong cơ sở tri thức Fuzzification bắt đầu với việc chọn các hàm thành viên phù hợp cho các tập mờ Hình 2.4.1 cho thấy một lựa chọn điển hình, một loạt các đoạn thẳng (Các lựa chọn khác là có thể, ví dụ: đường cong sigmoid.) Mỗi dấu
có thể là một thành viên của ít nhất một tập mờ Từ hình vẽ, chúng ta có thể thấy rằng khi
Trang 34Hình 2.4.1
Chúng ta cũng cần định lượng các thuật ngữ 'rất' và 'đúng hơn' Những
hàng rào ngôn ngữ này có thể được hiểu như sau:
Với những diễn giải này, một dấu ấn 80% có
Tóm lại: phép mờ hóa là quá trình hình thành ánh xạ từ đầu vào đã cho sang đầu ra bằng logic mờ Ánh xạ sau đó cung cấp một cơ sở mà từ đó các quyết định có thể được đưa ra, hoặc các mẫu được phân biệt
1.4.4.5 Phép khử mờ
Phương pháp chuyển đổi từ dữ liệu đầu vào là dữ liệu mờ và có đầu ra
là giá trị thực được gọi là phép khử mờ Nhưng trên thực tế về phương pháp hay cách thức khử mờ thì không có những ràng buộc hay định nghĩa cách thức chặt chẽ nào cả Các hệ thống dựa trên quy tắc mờ đánh giá các quy luật ngôn ngữ If-then bằng cách sử dụng độ mờ, suy luận và các thủ tục thành phần Chúng tạo ra kết quả mờ mà thường phải được chuyển đổi thành đầu ra rõ nét Đến biến đổi các kết quả mờ thành sự sắc nét Làm mờ
Trang 35là quá trình chuyển đổi một đầu ra bị mờ thành một giá trị rõ nét duy nhất đối với một bộ mờ
Đầu ra từ công cụ suy luận ( loại Mamdani) là mờ và chúng cần được chuyển đổi thành đầu ra rõ nét trước khi gửi chúng đến thiết bị truyền động để kiểm soát quá trình, việc chuyển đổi số lượng mờ thành rõ nét , giá trị đó được gọi là khử mờ
Trong một khía cạnh nào đó, về trực quan chúng ta có thể lựa chọn một phương pháp khử mờ được xem là tối ưu nhất Vào năm 1993 C.Thomas
và Hellendoorn đã đưa ra 5 tiêu chuẩn trực quan như sau:
• Tính không nhập nhằng (disambiguity), nghĩa là phương pháp chỉ sinh ra một giá trị đầu ra duy nhất
• Tính liên tục, nghĩa là khi ta tạo một sự thay đổi bất kỳ của dữ liệu đầu vào thì kết quả của đầu ra cũng thay đổi theo nó
• Độ phức tạp tính đơn giản, một đòi hỏi tự nhiên
• Tính hợp lý, với tính chất này nó yêu cầu giá trị đầu ra phải nằm
ở khu vực trung tâm của tập mờ và độ thuộc hay giá trị hàm thuộc tại đó phải lớn
• Tính trọng số của phương pháp (weighting method) phương pháp này tính đến trọng số hay mức độ ưu tiên của tập mờ kết quả đầu ra
Như vậy có thể kết luận là các tiêu chuẩn cần bảo đảm giá trị khử mờ của tập mờ A~ là phần tử thực đại diện một cách hợp lý của A~
Ngoài ra chúng ta có thể tham khảo thêm một số phương pháp khử mờ sau:
- Phương pháp khử mờ sử dụng cực đại trung bình có trọng số
- Phương pháp khử mờ sử dụng cực đại trung bình (average maximum)
- Phương pháp trọng tâm
Trang 361.5 Kết luận chương
Trong chương 1 này, luận văn đã trình bày về kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung, các đặc trưng cấp thấp của ảnh như màu sắc, kết cấu, hình dạng sử dụng trong tìm kiếm ảnh theo nội dung Trong đó, biểu đồ màu là kỹ thuật được sử dụng Ngoài ra, luận văn cũng trình bày khả năng ứng dụng của hệ thống CBIR trong nhiều lĩnh vực, giới thiệu một số hệ thống tìm kiếm ảnh theo nội dung tiêu biểu trên thế giới.Trình bày khái quát về logic mờ, tập hợp mờ, các đặc trưng, phép toán và các kiểu hàm thuộc của tập mờ
Trang 37CHƯƠNG 2 TÌM KIẾM ẢNH THEO NỘI DUNG TRÊN CƠ SỞ
BIỀU ĐỒ MÀU MỜ
2.1 Đo khoảng cách giữa các biểu đồ màu
Thông thường hệ thống tra cứu ảnh theo nội dung sẽ truy vấn hình ảnh bằng phương pháp đo tương tự dựa trên các đặc trưng, việc xác định nó
có thể dưới nhiều hình thức như phát hiện biên, màu sắc, vị trí điểm ảnh các phương pháp như histogram, màu sắc và phân tích histogram dòng cột
bộ mô tả ước lượng hình dạng khác nhau
Trong hình ảnh của máy tính, khoảng cách Euclide thường được sử dụng để đo khoảng cách màu giữa hai màu Và làm thế nào để đối phó với
sự thay đổi chiếu sáng vẫn là một chủ đề nghiên cứu quan trọng Tuy nhiên kết quả đánh giá đã chứng minh rằng khoảng cách Euclide không hoạt động tốt khi thay đổi ánh sáng vì mắt người có thể nhận ra các màu tương tự hoặc không liên quan dưới sự thay đổi chiếu sáng, nên một mô hình khoảng cách màu mới dựa trên nhận dạng hình ảnh được đề xuất Đầu tiên, chúng ta thấy rằng các màu sắc khác nhau được phân phối phức tạp trong không gian màu
Ta mở rộng để phân chia không gian HSV thành 3 không gian con ít phức tạp hơn và nghiên cứu các mô hình khoảng cách cụ thể của chúng Sau đó , một khoảng cách màu sắc mới được mô hình hóa dựa trên nhận dạng hình ảnh và mô hình khoảng cách màu sắc được đề xuất theo nguyên tắc khoảng
Trang 38cách màu sắc hình ảnh
2.1.1 Độ đo khoảng cách Minkowski(L p )
Độ đo khoảng cách Minkowski thích hợp để tính khoảng cách giữa hai ảnh có cùng chiều hoặc véc tơ đặc trưng của ảnh là độc lập và
có số bin màu giống nhau (xem hình 2.5)
Cho D(Q,I) là khoảng cách đo giữa hình ảnh truy vấn Q và hình ảnh I
trong CSDL và fi(Q) là số lượng điểm ảnh trong bin thứ I của ảnh Q thì
khoảng cách này được định nghĩa trong [6] là:
D (Q,I) = (∑|fi (Q) – fi(I)| p )1/p (2-1)
Trong đó p gọi là thành tố Minkowski (Minkowski Factor)
Cho trước 2 véc tơ n chiều: Q = [q1, q2,…, qn]T ; I = [i1, i2,…, in]T
- Nếu p = 1, độ đo là khoảng cách City block hay Manhattan có công thức tính:
(2-2)
- Nếu p = 2, độ đo là khoảng cách Euclide có công thức tính:
(2-3)
Trang 39Hình 2.5 Độ đo khoảng cách Minkowski
Độ đo khoảng cách Minkowski là độ đo được sử dụng phổ biến cho việc tìm kiếm hình ảnh Độ đo khoảng cách Euclide thường được sử dụng trong hệ thống tìm kiếm ảnh dựa trên nội dung
2.1.2 Độ đo khoảng cách toàn phương(Quaratic)
Độ đo khoảng cách toàn phương ngoài việc dùng để so sánh các Bin màu giống nhau nó còn được dùng để so sánh nhiều bin màu giữa các biểu đồ màu Nó được xác định bởi công thức:
d(Q,I)=(HQ –HI)t A(HQ –HI) ( 2-4)
Trang 40Hình 2.6: Độ đo khoảng cách Quadretic
Với Q và I là 2 ảnh để so sánh, HQ là biểu đồ màu của ảnh Q và
HI nó là biểu đồ màu của ảnh I, A =[ai,j] là một ma trận có kích thước
n * n trong đó n là số bin trong các biểu đồ màu, và ai,j biểu diễn sự
tương tự giữa màu i và màu j Độ đo khoảng cách Quaratic đã được
sử dụng trong nhiều hệ thống tìm kiếm hình ảnh dựa trên biểu đồ màu.Nó đã khắc phục được những thiếu sót của độ đo khoảng cách Euclide và biểu đồ màu giao nhau vì nó xem xét sự tương tự chéo giữa các màu sắc