1. Trang chủ
  2. » Luận Văn - Báo Cáo

luận văn thạc sĩ nghiên cứu phương pháp xây dựng hệ thống tìm kiếm ảnh theo nội dung sử dụng biểu đồ màu mờ

85 43 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 85
Dung lượng 3,39 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM Trịnh Trung Nghĩa LUẬN VĂN THẠC SĨ NGÀNH: HỆ THỐNG THÔNG TIN NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ

Trang 1

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

Trịnh Trung Nghĩa

LUẬN VĂN THẠC SĨ NGÀNH: HỆ THỐNG THÔNG TIN

NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ MÀU MỜ

Hà Nội – tháng 5 năm 2020

Trang 2

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

Trịnh Trung Nghĩa

LUẬN VĂN THẠC SĨ NGÀNH: HỆ THỐNG THÔNG TIN NGHIÊN CỨU PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG SỬ DỤNG BIỂU ĐỒ MÀU MỜ

Chuyên ngành: Hệ thống thông tin

Mã số: 8480104 CÁN BỘ HƯỚNG DẪN KHOA HỌC: PGS.TS ĐẶNG VĂN ĐỨC

Hà Nội , 2020

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn với tên đề tài “Nghiên cứu phương pháp tra cứu ảnh theo nội dung sử dụng biểu đồ màu mờ” là kết quả của việc học tập và nghiên cứu của bản thân học viên, thu thập cơ sở dữ liệu thực tiễn dưới sự hướng dẫn khoa học của PGS TS Đặng Văn Đức Các số liệu, kết quả đưa ra tại luận văn này của tôi là hoàn toàn đúng đắn và trung thực, những tài liệu thông tin sử dụng trong luận văn này được trích dẫn và có nguồn gốc rõ ràng, đầy đủ

Hà Nội, Ngày … Tháng … Năm 2020

Người cam đoan

Trịnh Trung Nghĩa

Trang 4

đỡ quan trọng trong quá trình thực hiện luận văn

Xin chân thành cảm ơn Ban quản lý Học Viện CNTT cùng toàn thể các Thầy

Cô giáo Viện Công Nghệ Thông Tin - Viện Hàn Lâm Việt Nam đã quan tâm tạo môi trường thuận lợi để cho tôi học tập và nghiên cứu chuyên sâu về lĩnh vực Công nghệ thông tin

Cuối cùng tôi cảm ơn tất cả những sự giúp đỡ của đồng nghiệp, bạn bè đã đóng góp ý kiến, động viên để tôi hoàn thành được luận văn này

Hà Nội, Ngày … Tháng 5 Năm 2020

Học Viên

Trịnh Trung Nghĩa

Trang 5

DANH MỤC KÝ HIỆU,CHỮ VIẾT TẮT

STT Từ viết tắt Từ viết đầy đủ Diễn giải

4 CIELAB Commission Internationale

del’Eclairage L-*a-*b color space

Không gian màu đồng nhất CIELAB

space

Không gian màu CMY

Trang 6

11 IBM International Business

13 L*a*b* L*a*b* color space Không gian màu đồng

16 RGB Red-Green-Blue color space Không gian màu RGB

18 YCbCr

Y-Luma (Brighnesshay Luminance); CbCr – ChromaBlue và Chroma Red color space

Không gian màu YCbCr

-chrominancechannels

Không gian màu YUV

Trang 7

DANH MỤC HÌNH ẢNH TRONG LUẬN VĂN

Hình 1.1: Tổng quan kiến trúc về hệ thống tra cứu ảnh

Hình 1.2: Tương quan màu sắc, ánh sáng với Mắt

Hình 1.3: Không gian màu RGB

Hình 1.4: Đặc trưng kết cấu của ảnh

Hình 2.1: Biểu đồ mô tả màu của ảnh

Hình 2.2: Biểu đồ màu của 3 ảnh khác nhau

Hình 2.3 : Công cụ tìm kiếm hình ảnh của Google

Hình 2.4: Phần bù của một tập mờ

Hình 2.5: Độ đo khoảng cách Minkowski

Hình 2.6: Độ đo khoảng cách Quadretic

Hình 2.7: Ảnh và biểu đồ màu của ảnh thử nghiệm

Hình 2.7.1: Tính khoảng cách giữa ảnh A và B sử dụng LCH

Hình 2.7.2: Sơ đồ thủ tục tính toán FCH (n’=163

= 4096) Hình 2.8: Sơ đồ khối hệ thống suy luận mờ

Hình 2.9: Hàm thành viên của L*,a* và b*

Hình 2.10: Hàm thành viên mờ đầu ra của hệ thống

Hình 2.11: Cấu trúc của biểu đồ màu mờ

Hình 2.12: Hệ thống suy luận mờ tạo ra biểu đồ màu mờ

Hình 2.13: Biểu đồ FCH - 1D tạo ra từ hệ thống liên kết mờ của ảnh truy vấn

Hình 3.1 Kiến trúc hệ thống tìm kiếm ảnh theo nội dung ở trong luận văn Hình 3.2 Kiểu dữ liệu struct trong CSDL đặc trưng trong Matlab

Hình 3.2 Biểu đồ chức năng hoạt động của xây dựng CSDL đặc trưng CCH trong không gian màu RGB, HSV

Trang 8

Hình 3.3 Biểu đồ chức năng hoạt động, xây dựng CSDL đặc trưng

FCH trong không gian màu L*a*b*

Hình 3.4 Biểu đồ hoạt động chức năng tìm kiếm ảnh trên cơ sở CCH

theo RGB hoặc HSV

Hình 3.6 Giao diện chính của chương trình thử nghiệm

Hình 3.7 Giao diện tìm kiếm và hiển thị ảnh kết quả của chương trình

Hình 3.8 Biểu đồ màu CCH và FCH của ảnh bus 340.jpg và ảnh đã thêm 15% nhiễu gaussian

Hình 3.9 Biểu đồ màu CCH và FCH của ảnh xe bus 340.jpg và

ảnh đã thay đổi độ sáng 15%

Hình 3.10 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với FCH

Hình 3.11 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trongRG Hình 3.12 Tìm kiếm hình ảnh xe bus đã thay đổi độ sáng với CCH trong HSV Bảng 3.1 Kết quả thử nghiệm độ chính xác với ảnh xe bus và một số ảnh khác nhau , đã tạo thêm 15% độ nhiễu Gausian và thay đổi độ sáng 15%

Bảng 3.2 Một số kết quả thử nghiệm tìm kiếm trong CSDL ảnh WANG

Bảng 3.3 Một số kết quả thử nghiệm từ chương trình tìm kiếm ảnh trên

CSDL ảnh y tế

Trang 9

MỤC LỤC

LỜI CAM ĐOAN 1

LỜI CẢM ƠN 2

DANH MỤC HÌNH ẢNH TRONG LUẬN VĂN 5

MỤC LỤC 7

PHẦN MỞ ĐẦU 10

CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG 12 1.1 Hệ thống tra cứu ảnh theo nội dung và những thành phần chính của nó 15

1.2 Các đặc trưng trong hệ thống tìm kiếm ảnh dựa trên nội dung 16

1.2.1 Đặc trưng màu sắc 16

Các đặc trưng về hình dạng của ảnh 18

1.2.2 Đặc trưng kết cấu 20

1.2.3 Biểu đồ màu 21

1.3 Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung 24

1.3.1 Công cụ tìm kiếm Google Image Search 25

1.3.2 Hệ thống QBIC (Query By ImageContent) 26

1.3.3 Hệ thống WebSEEK và VisualSEEK 26

1.4 Tổng quan về Logic mờ 27

1.4.1 Giới thiệu chung về Logic mờ 27

1.4.2 Khái niệm tập hợp mờ 29

1.4.3 Các đặc trưng của tập mờ 29

1.4.4 Các phép toán trên tập mờ 30

1.5 Kết luận chương 34

Trang 10

CHƯƠNG 2 TÌM KIẾM ẢNH THEO NỘI DUNG TRÊN CƠ SỞ

BIỀU ĐỒ MÀU MỜ 35

2.1 Đo khoảng cách giữa các biểu đồ màu 35

2.1.1 Độ đo khoảng cách Minkowski(L p ) 36

2.1.2 Độ đo khoảng cách toàn phương(Quaratic) 37

2.1.3 Độ đo khoảng cách biểu đồ giao nhau (Histogram Intersection Distance) 39

2.2 Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu thông thường 39

2.2.1 Biểu đồ màu toàn bộ (Global Color Histogram) 39

2.2.2 Biểu đồ màu cục bộ ( LCH ) 41

2.3 Tìm kiếm ảnh theo nội dung trên cơ sở biểu đồ màu mờ 43

2.3.1 Định nghĩa biểu đồ màu mờ(FCH) 43

2.3.2 Tính toán FCH và độ đo khoảng cách 43

2.3.3 Tính toán FCH trong không gian màu CIELAB sử dụng thuật toán phân cụm mờ 44

2.3.4 Phương pháp tạo biểu đồ màu dựa vào hệ thống liên kết mờ trong không gian màu L*a*b* 47

2.4 Tổng kết chương 54

CHƯƠNG 3 THỬ NGHIỆM 55

3.1 Giới thiệu bài toán thử nghiệm 55

3.2 Dữ liệu thử nghiệm 55

3.3 Mô tả hệ thống thử nghiệm 56

3.3.1 Xây dựng CSDL đặc trưng 56

3.3.2 Chức năng tìm kiếm ảnh 56

3.4 Môi trường và công cụ sử dụng xây dựng thử nghiệm 57

Trang 11

3.5 Thiết kế chương trình thử nghiệm 58

3.5.1 Xây dựng CSDL đặc trưng - Thiết kế CSDL đặc trưng 59

3.5.2 Thiết kế giao diện của chương trình thử nghiệm 63

3.6 Đánh giá kết quả thử nghiệm 64

3.6.1 Đo lường hiệu suất trong hệ thống tìm kiếm ảnh 64

3.6.2 Kết quả thử nghiệm 65

CHƯƠNG 4 KẾT LUẬN 78

TÀI LIỆU THAM KHẢO 80

PHỤ LỤC 1 82

Trang 12

PHẦN MỞ ĐẦU

Ngày nay với sự phát triển của của các phương tiện truyền thông, các phương tiện lưu trữ hình ảnh, cùng kích thước của các tập ảnh số được gia tăng một cách chóng mặt Thì việc tìm kiếm ảnh và lưu trữ ảnh sao cho nhanh chóng và hiệu quả là rất cần thiết với người dùng Việc tra cứu ảnh là nhu cầu rất cần thiết từ nhiều lĩnh vực khác nhau như: trinh sát, dự báo thời tiết, phòng chống tội phạm… Cùng chung mục đích này, rất nhiều các chương trình thiết

kế để tìm kiếm ảnh đã được xây dựng và ứng dụng trong thực tế Trong đó có hai nền tảng chính là: dựa trên văn bản (text-based) và dựa trên nội dung (content-based)

Các phương pháp tiếp cận trong những năm 1970 dựa trên văn bản được sử dụng nhiều Tại thời điểm đó các bức ảnh được con người chú thích bằng văn bản một cách thủ công , sau đó được lưu trữ bởi các hệ thống quản

lý cơ sở dữ liệu, và đưa vào thực hiện việc tra cứu ảnh Khi đó người ta nhận

ra một số nhược điểm của phương pháp này đó là:

Thứ nhất: Nó cần quá nhiều công sức lao động của con người để tạo chú thích cho những bức ảnh

Thứ hai là: nếu việc đánh chú thích không chuẩn do nhận thức chủ quan của mỗi người là khác nhau

Để khắc phục hai nhược điểm trên của hệ thống tra cứu ảnh dựa trên văn bản, khái niệm tra cứu ảnh dựa trên nội dung được giới thiệu vào đầu năm

1980

Với Luận văn này sẽ thể hiện một số kỹ thuật dựa trên phản hồi liên quan, được ứng dụng trong công nghệ tra cứu ảnh theo nội dung Để cải thiện hiệu năng tra cứu, thu hẹp khoảng cách về ngữ nghĩa Luận văn được chia làm 3 chương cụ thể như sau:

Chương 1: Các khái niệm chung về tra cứu ảnh dựa trên nội dung

Giới thiệu các kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung, các đặc trưng sử dụng trong tìm kiếm ảnh theo nội dung, khả năng ứng dụng và khái quát về Logic mờ

Trang 13

Chương 2: Đo khoảng cách giữa các biểu đồ màu, Tìm kiếm ảnh theo

nội dung dựa trên cơ sở biểu đồ màu thông thường, Tìm kiếm ảnh theo nội dung trên cơ sở biều đồ màu mờ

Chương 3: Áp dụng cài đặt chương trình thử nghiệm

Cài đặt chương trình tìm kiếm ảnh, thử nghiệm trên Matlab dựa theo kiến thức và lý thuyết từ các chương của luận văn

Trang 14

CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM ẢNH

THEO NỘI DUNG Giới thiệu:

Hiện nay với việc bùng nổ về hệ thống thông tin thì việc tìm kiếm thông tin dữ liệu có vai trò quan trọng, trong đó việc tìm kiếm ảnh cũng đang trở nên cần thiết Truy xuất thông tin hình ảnh dựa trên nội dung, hoặc truy xuất hình ảnh dựa trên nội dung là một trong những lĩnh vực nghiên cứu mạnh mẽ nhất trong lĩnh vực máy tính trong hơn 10 năm qua Sự sẵn có của

số lượng lớn dữ liệu trực quan và đa phương tiện đang phát triển, và sự phát triển của Internet nhấn mạnh đến các nhu cầu để tạo ra các phương thức truy cập theo chủ đề, cung cấp nhiều hơn các truy vấn hoặc yêu cầu dựa trên văn bản đơn giản, dựa trên các trường cơ sở dữ liệu chính xác

Có nhiều chương trình và công cụ đã được phát triển để hình thành và thực hiện các truy vấn dựa trên nội dung hình ảnh hoặc âm thanh, để giúp chạy duyệt các kho dữ liệu đa phương tiện lớn Tuy nhiên, không có bước đột phá chung nào đạt được đối với các cơ sở dữ liệu lớn khác nhau với các tài liệu thuộc các loại khác nhau về đặc điểm và nội dung Một số câu trả lời cho nhiều câu hỏi liên quan đến tốc độ, mô tả ngữ nghĩa hoặc giải thích hình ảnh khách quan vẫn chưa được trả lời

Để tìm kiếm ảnh hiện nay có hai cách: một là phương pháp tìm kiếm theo từ khoá và hai là tìm kiếm theo nội dung ảnh Phương pháp thứ nhất là tìm kiếm ảnh theo từ khoá phương pháp này người dùng khá ưa thích vì tính chất đơn giản và dễ thao tác Cùng với đó việc tìm kiếm ảnh dựa theo

từ khoá thì nhanh hơn so với tìm kiếm theo nội dung bởi vì tìm kiếm theo từ khóa hoạt động trên việc so sánh và phân tích các từ hay cụm từ khi xác định chúng giống với nhau thì đưa ra kết quả gần đúng nhất Do kiểu dữ liệu đầu vào là dạng văn bản nên việc tìm kiếm và xuất kết quả thực hiện một cách nhanh chóng, và không đòi hỏi người tìm kiếm phải chuẩn bị ảnh mẫu trước Bên cạnh đó việc tìm kiếm theo phương pháp này còn có một số hạn chế đó là kết quả tìm kiếm khi trả về đôi khi không đúng ý định ban đầu của người dùng

Trang 15

Để khắc phục các hạn chế trên thì phương pháp tìm kiếm ảnh dựa trên nội dung được ra đời để khắc phục những hạn chế này Tư tưởng chính của phương pháp tìm kiếm ảnh này là người ta tự động trực tiếp gắn mô tả cho những bức ảnh, phân tích nội dung ảnh mà không có sự can thiệp thủ công Điểm nổi bật của thuật toán này so với thuật toán tìm kiếm ảnh dựa trên từ khóa đó là nội dung của ảnh luôn luôn nhất quán và ở phần trích chọn đặc trưng của ảnh được thực hiện một cách tự động Trên thực tế, người sử dụng luôn thích dùng các từ khóa, để mô tả văn bản và giải thích cho hình ảnh của họ và đo độ tương tự Trên một khía cạnh nào đó những đặc trưng này được trích chọn tự động bằng việc sử dụng các kỹ thuật của thị giác máy và chủ yếu là các đặc trưng ở mức thấp như đặc trưng về hình dạng, đặc trưng về màu sắc ảnh, đặc trưng về kết cấu, …) Cho dù đã có nhiều thuật toán được đầu tư về kỹ thuật để mô tả các đặc trưng của ảnh như màu sắc, hình dạng nhưng vẫn không thể phản ánh hết các ngữ nghĩa của ảnh Phân tích nội dung đa phương tiện được áp dụng trong các ứng dụng thị giác máy tính trong thế giới thực khác nhau và hình ảnh kỹ thuật số là một phần chính của dữ liệu đa phương tiện Trong vài năm qua, sự phức tạp của nội dung đa phương tiện, đặc biệt là hình ảnh đã tăng theo cấp số nhân và trên cơ sở hàng ngày, hơn hàng triệu hình ảnh được tải lên tại các kho lưu trữ khác nhau như Twitter, Facebook và Instagram Để tìm kiếm một hình ảnh có liên quan từ một kho lưu trữ là một vấn đề nghiên cứu đầy thách thức cho cộng đồng nghiên cứu tầm nhìn máy tính Hầu hết các công cụ tìm kiếm lấy hình ảnh trên cơ sở các cách tiếp cận dựa trên văn bản truyền thống dựa trên chú thích và siêu dữ liệu Trong thập kỷ qua , nghiên cứu sâu rộng được báo cáo để tìm kiếm , ảnh dựa trên nội dung (CBIR) , phân loại hình ảnh và phân tích

Các khái niệm quan trọng và nghiên cứu chính dựa trên CBIR và biểu diễn hình ảnh sẽ được thảo luận chi tiết và các hướng nghiên cứu trong tương lai được kết luận và tạo điều kiện cho nghiễn cứu tiếp theo trong lĩnh vực này

Kỹ thuật tìm kiếm ảnh dựa trên nội dung (CBIR) đã được đưa vào như

Trang 16

một câu trả lời cho những khó khăn của cách tiếp cận dựa trên văn bản Kỹ thuật CBIR vượt qua rào cản đại diện cho một hình ảnh mang tính văn bản Trong các hệ thống CBIR , thuật toán xử lý hình ảnh được sử dụng và các vector đặc trưng được trích xuất tự động Các tính năng của hình ảnh là màu sắc, kết cấu và hình dạng Các vecto đặc trưng đại diện cho các tính năng này

Ưu điểm của CBIR :

- Quá trình thu hồi được xử lý một cách tự động

- Xử lý truy vấn cũng phụ thuộc vào diễn giải trực quan

Do vậy, các khái niệm đặc trưng mức cao và các đặc trưng

mức thấp vẫn còn nhiều nên hiệu suất của CBIR là vẫn còn

tương đối lớn với mong muốn của người sử dụng

Trang 17

1.1 Hệ thống tra cứu ảnh theo nội dung và những thành phần chính của nó

Một hệ thống tra cứu ảnh theo nội dung cần các thành phần sau:

Hình 1-1: Tổng quan về kiến trúc của hệ thống tra cứu ảnh

Trong một hệ thống tra cứu ảnh theo nội dung có ba thành phần quan trọng nhất đó là: Giao diện truy vấn cho người dùng, đánh chỉ số và trích chọn đặc trưng

Trang 18

1.2 Các đặc trƣng trong hệ thống tìm kiếm ảnh dựa trên nội dung

CBIR đề cập đến nội dung hình ảnh được lấy trực tiếp, qua đó các hình ảnh có tính năng nhất định hoặc chứa nội dung nhất định sẽ được tìm kiếm trong cơ sở dữ liệu hình ảnh Ý tưởng chính của CBIR là phân tích thông tin hình ảnh bằng các tính năng cấp thấp của hình ảnh, bao gồm: màu sắc, kết cấu, hình dạng và mối quan hệ không gian của các đối tượng, v.v và thiết lập các vector đặc trưng của hình ảnh làm chỉ mục Phương pháp truy xuất tập trung tính toán mức độ tương đồng giữa véc tơ đặc trưng đa chiều ảnh đầu vào và các véc tơ đặc trưng đa chiều trong CSDL

1.2.1 Đặc trƣng màu sắc

Hiện nay việc sử dụng đặc trưng màu sắc của ảnh trong tìm kiếm ảnh được sử dụng rất nhiều, đặc biệt trong lĩnh vực tra cứu ảnh dựa theo nội dung.Vì ta thấy được rằng trong một bức ảnh màu thì dữ liệu quan trọng nhất của nó là màu sắc Mặt khác, màu sắc có những đặc điểm rất dễ trong việc đánh chỉ số

và có tính trực quan, trích chọn theo thông tin màu của ảnh sau đó đưa ra những phân tích và tìm kiếm ảnh đã có hiệu quả thông qua biểu đồ màu

Có nhiều định nghĩa về màu, từ góc nhìn khoa học: Màu là phân bổ bước sóng λ (red: 700nm, violet: 400nm) hay tần số f của sóng điện từ.Từ quá trình

xử lý thị giác: Màu là thuộc tính quan sát vật thể, kết quả từ việc vật thể phát

ra, truyền hay phản xạ ánh sáng đến mắt người

Trang 19

H1.2 Tương quan màu sắc, ánh sáng với Mắt

Trong tra cứu ảnh việc sử dụng dặc trưng màu sắc được sử dụng phổ biến Trên một không gian màu thì các màu sắc được định nghĩa cụ thể Sự

đa dạng của không gian màu là có sẵn, rất nhiều ứng dụng hiện nay đều đang sử dụng, khai thác các đặc trưng của ảnh

Các vấn đề chính trong khai thác đặc trưng màu bao gồm không gian màu, và lựa chọn chức năng tương tự Các nghiên cứu khác nhau

về nhận thức màu sắc và không gian màu đã được đề xuất Có thể hiểu rằng không gian màu là mô hình toán học trừu tượng dùng để mô tả cách biểu diễn màu mà con người có thể nhận biết bởi bộ các chữ số (có giá trị )hay bởi các thành phần màu.Tại mỗi điểm ảnh trên một bức ảnh nào đó ta có thể biểu diễn được bằng một điểm trong một không gian màu 3 chiều

Trang 20

Hình 1.3 Không gian màu RGB

RGB là không gian màu được sử dụng nhiều nhất hiện nay để hiển thị ảnh, RBG bao gồm 3 thành phần màu cụ thể là: màu đỏ, màu xanh lá và màu xanh lam Không gian RGB là một dạng của mô hình cộng bởi vì các màu sắc trong không gian này có thể cộng lại với nhau tạo ra một màu sắc cụ thể nào đó

Cách biểu diễn một màu tùy ý trong dãy hiển thị được thực hiện bằng cách tổ hợp ba màu Đỏ, Xanh lá và Xanh Lam với nhau, gán giá trị từ 0 đến 1 cho R(1,0,0), G(0,1,0), B(0,0,1) Ví dụ: Red (1,0,0) + Blue (0,0,1)

→Magenta (1,0,1) Đường chéo từ (0,0,0) đến ( 1,1, 1 ) biểu diễn màu xám Tuy nhiên không gian màu RGB không thể biểu diễn mọi màu trong phổ nhìn thấy

Các đặc trƣng về hình dạng của ảnh

Khi ta so sánh đặc trưng về hình dạng với các đặc trưng về màu sắc hay đặc trưng về kết cấu thì các đặc trưng của hình dạng thường chỉ được sử dụng sau khi ảnh đã phân tách thành các vùng hoặc các đối tượng ảnh Bởi

Trang 21

vì khi ta tách đối tượng ảnh cùng phân vùng rất khó có thể thu được kết quả tốt chính vì thế việc sử dụng các đặc điểm hình dạng của ảnh để tìm kiếm ảnh thường bị bó hẹp trong một vài ứng dụng mà ở đó các vùng ảnh hoặc đối tượng ảnh đã được tách biệt rõ ràng

Có 2 loại trích chọ đặc trưng cơ bản đó là: trích chọn dựa theo đường biên và trích chọn dựa theo vùng của ảnh

Khi thực hiện phép toán trích chọn đặc trưng của ảnh người ta thường tách đối tượng ra khỏi ảnh VD “bức ảnh cô gái đứng trên bãi biển “ thì trước tiên người ta tách đối tượng ra khỏi ảnh tức là sẽ phải tách hình “cô gái ” ra khỏi nền của bức ảnh ( nền là cảnh bãi biển )

Hình 1.4: Đặc trưng về hình dạng

Cách biểu diễn theo đường viền bao quanh chỉ sử dụng đường biên bên ngoài của hình dạng, để làm được điều này người ta sử dụng cách mô tả vùng đang quan tâm bằng cách đặc tính bên ngoài của nó, có nghĩa là các điểm ảnh dọc theo đường viền bao quanh đối tượng ảnh Cách biểu diễn theo vùng là cách sử dụng cả vùng ảnh bằng cách mô tả vùng đang quan tâm bằng các đặc tính bên trong tức là các điểm ảnh ở bên trong vùng đó

Trang 22

1.2.2 Đặc trƣng kết cấu

Trong các đặc trưng của ảnh thì đặc trưng “kết cấu” là một đặc trưng có tầm ảnh hưởng lớn nhất và cần thiết nhất Đặc trưng kết cấu có ảnh hưởng rất lớn đến sự nhận thức trực quan của người dùng khi họ nhìn vào nó Các vùng của ảnh được nó cung cấp bản mẫu trực quan Đặc trưng kết cấu gồm các thuộc tính như: Thuộc tính thô, độ tương phản, hướng, chu kỳ, tính ngẫu nhiên và tính quy luật

Hình 1.4: Đặc trưng kết cấu của ảnh Khác với đặc trưng hình dạng, đặc trưng kết cấu thể hiện trên một vùng chứ không phải tại một điểm ảnh và thường được định nghĩa bằng các mức xám

Rất nhiều nghiên cứu trong các lĩnh vực như nhận dạng và thị giác máy tính nó thể hiện được đặc trưng kết cấu của hình ảnh Nhìn nhận một cách chủ quan thì có 2 cách biểu diễn kết cấu đó là: phương pháp thống kê và Phương pháp cấu trúc

Các phương pháp cấu trúc bao gồm các đồ thị liền kề và toán tử hình thái,

mô tả kết cấu bằng cách định nghĩa các nguyên thuỷ cấu trúc và luật sắp

Trang 23

đặt của chúng Các phương pháp cho thấy hiệu quả rõ rệt khi áp dụng trong trường hợp kết cấu thông thường

Một số phương pháp thống kê gồm các phương pháp: Phương pháp ma trận đồng khả năng, phổ năng lượng Fourier, Tamura, Phân tích Wold, trường ngẫu nhiên Markov, Không gian fractal ,các bộ lọc đa phân giải như biến đổi Gabor và biến đổi dạng sóng thể hiện kết cấu bằng sự phân

bố thống kê của độ sáng của các điểm ảnh

1.2.3 Biểu đồ màu

Biểu đồ màu của một bức ảnh thể hiện được sự đặc trưng trong bố cục màu sắc của ảnh đó, các biểu đồ như này là một bảng sơ đồ về màu sắc của ảnh nào đó Công việc tính toán dựa trên biểu đồ màu của ảnh được tiến hành rất nhanh chóng, nó chỉ cần duyệt qua một lần toàn bộ ảnh Vì thế việc sử dụng biểu đồ màu trong việc tìm kiếm ảnh sẽ đem lại cho chúng ta kết quả rất khả quan về phương diện tốc độ tìm kiếm

Hình 2.1: Biểu đồ mô tả màu của ảnh

Biểu đồ màu là đặc trưng rất quan trọng của ảnh và nó thường được ứng dụng trong các hệ thống tìm kiếm ảnh theo nội dung Ở chương 2, luận văn này trình bày cụ thể về phương pháp tìm kiếm ảnh theo nội dung dựa trên biểu đồ màu mờ và biểu đồ màu thông thường Các phương pháp đưa ra đều có tính cải thiện độ chính xác cũng như tốc độ tìm kiếm ảnh

Trang 24

1.2.3.1 Biểu đồ màu toàn cục (Global Color Histogram)

Biểu đồ màu toàn cục có tên tiếng anh là: Global Color Histogram,

đây là dạng biểu đồ mô tả sự bố trí của màu sử dụng trong tập các màu Để

sử dụng biểu đồ màu toàn cục này thì trước tiên bức ảnh sẽ phải mã hóa với biểu đồ màu của nó và khoảng cách giữa hai ảnh sẽ được xác định bởi khoảng cách giữa các biểu đồ màu của chúng Với phương pháp này ta có thể sử dụng các thước đo khoảng cách để tính toán khoảng cách giữa các biểu đồ màu với nhau

Biểu đồ mầu toàn cục là sự thể hiện sự phân bố màu sắc trong một hình ảnh Biểu đồ màu đại diện cho hình ảnh nhưng từ một góc nhìn khác Biểu đồ màu đếm các pixel tương tự và lưu trữ nó trong các bins để mô tả số lượng pixel trong mỗi phạm vi màu một cách độc lập Biểu đồ màu là một

mô tả màu và như chúng ta đã biết răng mỗi mô tả chứa một thuật toán trích xuất tính năng và một chức năng phù hợp

Tham khảo ví dụ mô tả hoạt động của biểu đồ màu này:

Cho một biểu đồ với 3 màu : Đen, Trắng và Vàng Ta kí hiệu biểu đồ

Trang 25

Trong trường hợp nếu hai ảnh khách nhau nhưng có biểu đồ toàn cục giống nhau ví dụ trên ( ảnh B và C ) Thì nó cho ta thấy rõ ràng điểm cực kỳ hạn chế của biểu đồ màu toàn cục

● ảnh A:{25%, 25%, 50%};

● ảnh B: {18.75%, 37.5%, 43.75%};

● ảnh C: {18.75%, 37.5%, 43.75%}

Hình 2.2 :Biểu đồ màu của 3 ảnh khác nhau

1.2.3.2 Biểu đồ màu tương quan (Color Correlogram Histogram)

Biểu đồ màu tương quan được phát triển để khắc phục những vấn đề

mà trong không gian màu, mà thông qua lược đồ ta thấy được những thông tin về màu sắc còn thiếu sót Lược đồ màu này không những có thể biểu diễn sự phân phối màu của các điểm ảnh mà nó còn là thể hiện sự tương quan về không gian giữa các cặp màu do lược đồ chỉ chú ý tới sự tương quan về không gian, giống nhau giữa những màu do vậy chi phí tính toán và

số chiều được giảm đi đáng kể

Biểu đồ tương quan màu sắc được đề xuất để mô tả không chỉ thể hiện sự phân chia màu sắc của pixel mà còn cả tương quan không gian của các cặp màu Kích thước thứ nhất và thứ của biểu đồ ba chiều là màu sắc của bất kỳ cặp pixel nào và chiều thứ ba là khoảng cách không gian của chúng Biểu đồ tương quan màu là bảng được lập chỉ mục bởi các cặp màu

Cho một tương quan màu với các chỉ số đánh theo bảng bởi các cặp

Trang 26

màu Với mỗi pixel có màu i trong ảnh, là xác suất tìm thấy một pixel có màu j các pixel ban đầu một khoảng cách k Cho I biểu diễn toàn bộ tập các pixel ảnh và Ic(i) biểu diễn tập các pixel có màu C(i) thì tương quan màu được định nghĩa bằng:

Trong đó: p2 ЄI, p1 Є Ic(i)

k Є {1,2,…,d}

i, j Є {1,2,…,N}

|p1-p2| là khoảng cách giữa các pixel p1

và p2 Kích thước của Correlogram là

O(N2d)

Khi chọn d để tính Correlogram ta cần chú ý vấn đề sau:

Giá trị d lớn thì cần nhiều chi phí tính toán và không gian lưu

trữ

Giá trị d nhỏ có thể giảm giá trị lưu trữ của đặc trưng

Khi đem vector liên kết màu với lược đồ màu hay tương quan màu người ta nhận thấy kết tìm kiếm tốt hơn, nhưng mặt khác vì nó có chiều cao lớn hơn nên chi phí tính toán cũng lớn hơn

Kết luận: Tương quan màu sắc không những chỉ thể hiện sự tương quan không gian của các cặp màu, mà nó còn mô tả sự phân bố màu sắc của các pixel

1.3 Khả năng ứng dụng của hệ thống tìm kiếm ảnh theo nội dung

Hiện nay việc tra cứu ảnh được sử dụng trong rất nhiều ngành nghề lĩnh vực khác nhau như :

− Ứng dụng trong Quân đội

− Hỗ chợ chuẩn đoán trong y học

− Quản lý tài sản trí tuệ

Trang 27

− Ứng dụng trong dư báo thời tiết

− Thiết kế chi tiết máy

− Thiết kế nội thất và xây dựng

− Báo chí quảng cáo

− Giải trí

Một số hệ thống tra cứu ảnh dựa trên nội dung phổ biến hiện nay

Trong những năm gần đây, có rất nhiều hệ thống tra cứu ảnh được phát triển ra đời, Các chương trình tra cứu ảnh dựa theo nội dung được xây dựng cẩn thận bằng cách sử dụng chi tiết số liệu thống kê, logic mờ, nhận dạng khuôn mẫu, máy tính ,tính toán mềm và xử lý các dữ liệu Cùng với đó các chương trình nghiên cứu và ứng dụng thương mại đã được xây dựng một cách bài bản và quy mô Sau đây học viên sẽ giới thiệu một số hệ thống của tra cứu ảnh phổ biến hiện nay mà hầu như mọi người đều biết

1.3.1 Công cụ tìm kiếm Google Image Search

Một công cụ tìm kiếm mà hầu hết mọi người khi sử dụng internet đều biết đến đó là Google, trong các chương trình tìm kiếm của google thì google ảnh là một trong những thành công to lớn của họ, nó giúp người dùng tra cứu ảnh theo nôi dung hay bằng chính những hình ản sẵn có và trả

về kết quả khá chính xác Google Image Search hỗ trợ một số thuộc tính cơ bản như kích thước, hình dạng,… để người dùng tra cứu chuẩn xác hơn

Trang 28

Hình 2.3 : Công cụ tìm kiếm ảnh của Google

1.3.2 Hệ thống QBIC (Query By ImageContent)

IBM một tập đoàn công nghệ máy tính đa quốc gia có trụ sở tại Armonk, New York, Mỹ đã phát triển và đưa ra một hệ thống có tên gọi là Query By Image Content ( QBIC ) đó một hệ thống tìm kiếm ảnh thương mại được nhiều người biết đến trong số các hệ thống tra cứu ảnh dựa trên nội dung đã từng phát triển Nó cho phép truy vấn các CSDL hình ảnh lớn bằng các thuộc tính trực quan ví dụ như: tỉ lệ màu sắc, màu sắc hay hình dạng, kết cấu, và từ các bức vẽ phác hoạ,cũng như các từ khóa

Thông thường bất kỳ thuộc tính trực quan nào cũng có thể được

sử dụng trong truy vấn Nhưng khi các thuộc tính trực quan đó có thể kết hợp với từ khoá để tạo thành một truy vấn tổng hợp sẽ cải tiến hiệu quả truy vấn Phần mềm QBIC và trình diễn có tại

http://www.qbic.almaden.ibm.com[3]

1.3.3 Hệ thống WebSEEK và VisualSEEK

WebSEEK là một trong những hệ thống nguyên mẫu truy vấn

Trang 29

trực quan dựa trên nội dung được phát triển bởi Đại học Columbia Nó được thiết kế đặc biệt để tìm kiếm hình ảnh và video trên WWW Trong Web SEEK, các hình ảnh được phân tích trong hai quy trình tự động riêng biệt

- Quy trình đầu tiên là trích chọn và lập chỉ mục các đặc trưng trực quan như biểu đồ màu và kết cấu

- Quy trình thứ hai là phân tích văn bản liên quan và phân loại hình ảnh thành các lớp chủ đề theo một phân loại hình ảnh tùy chỉnh Có trên 2000 lớp hình ảnh trong hệ thống phân loại Ví dụ như các lớp chủ đề về thể thao, du lịch, cây cối và các lớp con của chúng

Một mẫu thử nghiệm nâng cao được gọi là Visual SEEK cũng được phát triển Visual SEEK tăng cường khả năng tìm kiếm bằng cách tích hợp các truy vấn không gian (như những người sử dụng trong GIS) và các truy vấn đặc trưng trực quan hình ảnh Người dùng yêu cầu hệ thống tìm kiếm ảnh bao gồm các vùng có các đặc trưng phù hợp và mối quan hệ không gian Web SEEK có thể được truy cập từ

1.4 Tổng quan về Logic mờ

1.4.1 Giới thiệu chung về Logic mờ

Askar Zadeh phát triển lên từ lý thuyết tập mờ từ 1965 ông đã cho ra đời hàng loạt các lý thuyết về tập mờ và được đăng trên báo và các tạp

chí lớn tại Mỹ như “Information and Control” bài báo của ông đã mở

đường cho hàng loạt của những nghiên cứu sau này, áp dụng phương pháp lập luận một cách tương đối thay vì lập luận chính xác theo các

cho phép chúng ta có thể khái quát hóa giá trị của các mệnh đề mờ, vì

Trang 30

thế mà ta có thể làm cho thiết bị máy móc hiểu được các thông tin mà ta truyền vào qua các ngôn ngữ tự nhiên,và một điều tuyệt vời là chúng có thể “hiểu” khá chính xác những nội dung mà ta truyển vào Logic mờ đang được sử dụng trong nhiều ứng dụng liên quan đến nhận dạng, xử

lý hình ảnh, xử lý ngôn ngữ, điểu khiển tự động, truy vấn bằng nội dung hình ảnh, phát hiện ranh rới, theo dõi đối tượng

Logic mờ là một công cụ tính toán dùng để sử dụng những kiến thức của con người vào các thuật toán khả thi Ý tưởng về logic mờ được giới thiệu bởi tiến sỹ Lofti Zadeh của UC-Berkley vào năm 1960, là một cách thức của mô hình về sự không chắc chắn của ngôn ngữ tự nhiên

Logic mờ đã được áp dụng gần đây trong quá trình kiểm soát, mô hình hóa, ước tính, xác định, dự đoán thị trường chứng khoán, chẩn đoán, khoa học, quân sự, nông nghiệp , và nhiều lĩnh vực khác Một trong những ứng dụng tiên phong trong logic mờ là trong các hệ thống điều khiển

Điều khiển dựa trên logic mờ được sử dụng trong các ứng dụng khác nhau Suốt trong nhiều năm qua, kiểm soát dựa trên logic mờ đã xuất hiện như một trong những các lĩnh vực tích cực và hiệu quả nhất

để nghiên cứu ứng dụng lý thuyết logic mờ, đặc biệt là trong phạm vi rộng của quá trình công nghiệp thiếu dữ liệu định lượng liên quan đến đầu vào - đầu ra

Không thể phủ nhận những thành công và những mặt tích cực mà logic mờ đem lại Logic mờ đã được chấp nhận và sử dụng rộng rãi nhưng bên cạnh

đó nó vẫn bị phê phán bởi những quan điểm bất đồng tại một vài trường phái nghiên cứu khác

Trang 31

1.4.2 Khái niệm tập hợp mờ

Khái niệm Tập hợp mờ hay còn gọi là “Tập mờ” là mở rộng của khái niệm tập hợp cổ điển, dùng để đáp ứng nhu cầu biểu diễn những tri thức không chính xác

Để hiểu thế nào là logic mờ, trước hết cần hiểu thế nào là tập hợp

mờ (fuzzy set)

- Cho X là một không gian nền

- A là tập mờ hoặc tập con mờ trên không gian nền X khi và chỉ khi A được xác định bởi hàm :

μA được gọi là hàm thuộc hay hàm thành viên (Membership Function) để chỉ phụ thuộc của các phần tử trong tập X vào tập A

Nên μA(x) còn được gọi là mức độ phụ thuộc (membership

degree hoặc degree of membership ) của phần tử x Î X lên tập A

1.4.3 Các đặc trƣng của tập mờ

Các đặc trưng của một tập mờ A trên X, được hiểu là những thông tin để mô tả về các phần tử liên quan đến tập mờ A, những đặc trưng này có thể chỉ rõ sự khác biệt của những tập con cổ điển khác của

X với tập mờ A

Định nghĩa 1.4.3.1

Giá đỡ của tập mờ A (Support) là tập các phần tử có giá trị hàm thuộc lớn hơn 0 trong tập mờ A, được ký hiệu và xác định như sau:

Trang 32

supp(A) = {x | x ∈ X | μA(x) > 0}

Định nghĩa 1.4.3.2

Chiều cao của tập mờ A (Hight) là giá trị lớn nhất mà hàm thuộc

có thể lấy trong tập mờ A, được ký hiệu và xác định như sau:

h(A) = sup{μA(x), x ∈ X}

Như vậy, tập mờ A có nhân khác rỗng khi và chỉ khi A là tập mờ chuẩn hóa

1.4.4 Các phép toán trên tập mờ

1.4.4.1 Phép hợp ( U )

Trên tập vũ trụ U cho hai tập mờ A~

và B~ Hợp của hai tập mờ này

là một tập mờ được ký hiệu là mà hàm thuộc của nó được định nghĩa theo điểm như sau :

hay, trong trường hợp U là hữu hạn hay đếm được,

Một cách tổng quát, cho ∈ F(U), i ∈ I, với I là tập chỉ số hữu hạn hay vô hạn nào đó Khi đó, hợp của các tập mờ như vậy, ký hiệu là , được định nghĩa bằng hàm thuộc như sau:

1.4.4.2 Phép giao ∩

Phép giao của A và B được ký hiệu là: A ∩ B

Phép giao sẽ có hàm thuộc một trong các định nghĩa sau:

Trang 33

1.4.4.3 Phép lấy phần bù ~

Cho A là tập mờ trong X có hàm thuộc µA Phần bù ¬A của A trong

X là một tập mờ có hàm thuộc xác định như sau:

𝜇¬A = 1 − 𝜇 , ∀x ∈ X

Hình 2.4: Phần bù của một tập mờ

1.4.4.4 Phép mờ hóa (Fuzzification)

Fuzzification là quá trình chuyển đổi giá trị đầu vào rõ nét thành giá trị

mờ được thực hiện bằng cách sử dụng thông tin trong cơ sở tri thức Fuzzification bắt đầu với việc chọn các hàm thành viên phù hợp cho các tập mờ Hình 2.4.1 cho thấy một lựa chọn điển hình, một loạt các đoạn thẳng (Các lựa chọn khác là có thể, ví dụ: đường cong sigmoid.) Mỗi dấu

có thể là một thành viên của ít nhất một tập mờ Từ hình vẽ, chúng ta có thể thấy rằng khi

Trang 34

Hình 2.4.1

Chúng ta cũng cần định lượng các thuật ngữ 'rất' và 'đúng hơn' Những

hàng rào ngôn ngữ này có thể được hiểu như sau:

Với những diễn giải này, một dấu ấn 80% có

Tóm lại: phép mờ hóa là quá trình hình thành ánh xạ từ đầu vào đã cho sang đầu ra bằng logic mờ Ánh xạ sau đó cung cấp một cơ sở mà từ đó các quyết định có thể được đưa ra, hoặc các mẫu được phân biệt

1.4.4.5 Phép khử mờ

Phương pháp chuyển đổi từ dữ liệu đầu vào là dữ liệu mờ và có đầu ra

là giá trị thực được gọi là phép khử mờ Nhưng trên thực tế về phương pháp hay cách thức khử mờ thì không có những ràng buộc hay định nghĩa cách thức chặt chẽ nào cả Các hệ thống dựa trên quy tắc mờ đánh giá các quy luật ngôn ngữ If-then bằng cách sử dụng độ mờ, suy luận và các thủ tục thành phần Chúng tạo ra kết quả mờ mà thường phải được chuyển đổi thành đầu ra rõ nét Đến biến đổi các kết quả mờ thành sự sắc nét Làm mờ

Trang 35

là quá trình chuyển đổi một đầu ra bị mờ thành một giá trị rõ nét duy nhất đối với một bộ mờ

Đầu ra từ công cụ suy luận ( loại Mamdani) là mờ và chúng cần được chuyển đổi thành đầu ra rõ nét trước khi gửi chúng đến thiết bị truyền động để kiểm soát quá trình, việc chuyển đổi số lượng mờ thành rõ nét , giá trị đó được gọi là khử mờ

Trong một khía cạnh nào đó, về trực quan chúng ta có thể lựa chọn một phương pháp khử mờ được xem là tối ưu nhất Vào năm 1993 C.Thomas

và Hellendoorn đã đưa ra 5 tiêu chuẩn trực quan như sau:

• Tính không nhập nhằng (disambiguity), nghĩa là phương pháp chỉ sinh ra một giá trị đầu ra duy nhất

• Tính liên tục, nghĩa là khi ta tạo một sự thay đổi bất kỳ của dữ liệu đầu vào thì kết quả của đầu ra cũng thay đổi theo nó

• Độ phức tạp tính đơn giản, một đòi hỏi tự nhiên

• Tính hợp lý, với tính chất này nó yêu cầu giá trị đầu ra phải nằm

ở khu vực trung tâm của tập mờ và độ thuộc hay giá trị hàm thuộc tại đó phải lớn

• Tính trọng số của phương pháp (weighting method) phương pháp này tính đến trọng số hay mức độ ưu tiên của tập mờ kết quả đầu ra

Như vậy có thể kết luận là các tiêu chuẩn cần bảo đảm giá trị khử mờ của tập mờ A~ là phần tử thực đại diện một cách hợp lý của A~

Ngoài ra chúng ta có thể tham khảo thêm một số phương pháp khử mờ sau:

- Phương pháp khử mờ sử dụng cực đại trung bình có trọng số

- Phương pháp khử mờ sử dụng cực đại trung bình (average maximum)

- Phương pháp trọng tâm

Trang 36

1.5 Kết luận chương

Trong chương 1 này, luận văn đã trình bày về kiến trúc tổng quan hệ thống tìm kiếm ảnh theo nội dung, các đặc trưng cấp thấp của ảnh như màu sắc, kết cấu, hình dạng sử dụng trong tìm kiếm ảnh theo nội dung Trong đó, biểu đồ màu là kỹ thuật được sử dụng Ngoài ra, luận văn cũng trình bày khả năng ứng dụng của hệ thống CBIR trong nhiều lĩnh vực, giới thiệu một số hệ thống tìm kiếm ảnh theo nội dung tiêu biểu trên thế giới.Trình bày khái quát về logic mờ, tập hợp mờ, các đặc trưng, phép toán và các kiểu hàm thuộc của tập mờ

Trang 37

CHƯƠNG 2 TÌM KIẾM ẢNH THEO NỘI DUNG TRÊN CƠ SỞ

BIỀU ĐỒ MÀU MỜ

2.1 Đo khoảng cách giữa các biểu đồ màu

Thông thường hệ thống tra cứu ảnh theo nội dung sẽ truy vấn hình ảnh bằng phương pháp đo tương tự dựa trên các đặc trưng, việc xác định nó

có thể dưới nhiều hình thức như phát hiện biên, màu sắc, vị trí điểm ảnh các phương pháp như histogram, màu sắc và phân tích histogram dòng cột

bộ mô tả ước lượng hình dạng khác nhau

Trong hình ảnh của máy tính, khoảng cách Euclide thường được sử dụng để đo khoảng cách màu giữa hai màu Và làm thế nào để đối phó với

sự thay đổi chiếu sáng vẫn là một chủ đề nghiên cứu quan trọng Tuy nhiên kết quả đánh giá đã chứng minh rằng khoảng cách Euclide không hoạt động tốt khi thay đổi ánh sáng vì mắt người có thể nhận ra các màu tương tự hoặc không liên quan dưới sự thay đổi chiếu sáng, nên một mô hình khoảng cách màu mới dựa trên nhận dạng hình ảnh được đề xuất Đầu tiên, chúng ta thấy rằng các màu sắc khác nhau được phân phối phức tạp trong không gian màu

Ta mở rộng để phân chia không gian HSV thành 3 không gian con ít phức tạp hơn và nghiên cứu các mô hình khoảng cách cụ thể của chúng Sau đó , một khoảng cách màu sắc mới được mô hình hóa dựa trên nhận dạng hình ảnh và mô hình khoảng cách màu sắc được đề xuất theo nguyên tắc khoảng

Trang 38

cách màu sắc hình ảnh

2.1.1 Độ đo khoảng cách Minkowski(L p )

Độ đo khoảng cách Minkowski thích hợp để tính khoảng cách giữa hai ảnh có cùng chiều hoặc véc tơ đặc trưng của ảnh là độc lập và

có số bin màu giống nhau (xem hình 2.5)

Cho D(Q,I) là khoảng cách đo giữa hình ảnh truy vấn Q và hình ảnh I

trong CSDL và fi(Q) là số lượng điểm ảnh trong bin thứ I của ảnh Q thì

khoảng cách này được định nghĩa trong [6] là:

D (Q,I) = (∑|fi (Q) – fi(I)| p )1/p (2-1)

Trong đó p gọi là thành tố Minkowski (Minkowski Factor)

Cho trước 2 véc tơ n chiều: Q = [q1, q2,…, qn]T ; I = [i1, i2,…, in]T

- Nếu p = 1, độ đo là khoảng cách City block hay Manhattan có công thức tính:

(2-2)

- Nếu p = 2, độ đo là khoảng cách Euclide có công thức tính:

(2-3)

Trang 39

Hình 2.5 Độ đo khoảng cách Minkowski

Độ đo khoảng cách Minkowski là độ đo được sử dụng phổ biến cho việc tìm kiếm hình ảnh Độ đo khoảng cách Euclide thường được sử dụng trong hệ thống tìm kiếm ảnh dựa trên nội dung

2.1.2 Độ đo khoảng cách toàn phương(Quaratic)

Độ đo khoảng cách toàn phương ngoài việc dùng để so sánh các Bin màu giống nhau nó còn được dùng để so sánh nhiều bin màu giữa các biểu đồ màu Nó được xác định bởi công thức:

d(Q,I)=(HQ –HI)t A(HQ –HI) ( 2-4)

Trang 40

Hình 2.6: Độ đo khoảng cách Quadretic

Với Q và I là 2 ảnh để so sánh, HQ là biểu đồ màu của ảnh Q và

HI nó là biểu đồ màu của ảnh I, A =[ai,j] là một ma trận có kích thước

n * n trong đó n là số bin trong các biểu đồ màu, và ai,j biểu diễn sự

tương tự giữa màu i và màu j Độ đo khoảng cách Quaratic đã được

sử dụng trong nhiều hệ thống tìm kiếm hình ảnh dựa trên biểu đồ màu.Nó đã khắc phục được những thiếu sót của độ đo khoảng cách Euclide và biểu đồ màu giao nhau vì nó xem xét sự tương tự chéo giữa các màu sắc

Ngày đăng: 07/08/2020, 17:07

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Đặng Văn Đức, 2005-2017, CSDL đa phương tiện, Bài giảng cho học viên sau đại học Sách, tạp chí
Tiêu đề: CSDL đa phương tiện
[2] Nguyễn Thị Hoàn, Phương pháp trích chọn đặc trưng ảnh trong thuật toán học máy tìm kiếm ảnh áp dụng vào bài toán tìm kiếm sản phẩm, Đại học quốc gia Hà Nội Sách, tạp chí
Tiêu đề: Phương pháp trích chọn đặc trưng ảnh trong thuật toán học máy tìm kiếm ảnh áp dụng vào bài toán tìm kiếm sản phẩm
[4] Lư Minh Phúc và Trần Công Án, 2017 Báo cáo đề tài: Tìm kiếm ảnh theo nội dung và ngữ nghĩa ,Khoa Công nghệ Thông tin và Truyền thông, Trường Đại học Cần Thơ Sách, tạp chí
Tiêu đề: Tìm kiếm ảnh theo nội dung và ngữ nghĩa
[6] Guojun Lu, 2009, Multimedia Database Management Systems, Artech House, Boston – London Sách, tạp chí
Tiêu đề: Multimedia Database Management Systems
[12] Chang, Ran, 2013, "Effective graph-based content-based image retrieval systems for large-scale and small-scale image databases", Doctor of Philosophy, Utah State University Sách, tạp chí
Tiêu đề: Effective graph-based content-based image retrieval systems for large-scale and small-scale image databases
[13] Ying Liu, Dengsheng Zhang, Guojun Lu, Wei-ying Ma, 2007, “A survey of content-based image retrieval with high-level semantics,”Pattern recognition, volume 40, issue 1, January Sách, tạp chí
Tiêu đề: A survey of content-based image retrieval with high-level semantics
[14] H.K.Huang (2010), “PACS and Imaging Informatics”, Nhà xuất bản John Wiley & Sons, Feb 12 Sách, tạp chí
Tiêu đề: PACS and Imaging Informatics”, "Nhà xuất bản John Wiley & Sons
Tác giả: H.K.Huang
Nhà XB: Nhà xuất bản John Wiley & Sons"
Năm: 2010
[15] Ebert, D., F. Musgrave, D. Peachey, K. Perlin, S. Worley, W. Mark, and J. Hart. 2002. Texturing and Modeling: A Procedural Approach.Morgan Kaufmann Sách, tạp chí
Tiêu đề: Texturing and Modeling: A Procedural Approach
[3] Trần Thị Thanh Hải, Eric Marchand, Một số phương pháp đối sánh ảnh thời gian thực, Trung tâm MICA, Đại học Bách Khoa Hà Nội Khác
[5] Constantin Vertan, Nozha Boujemaa, 2000, Using Fuzzy Histograms and Distances for Color Image Retrieval, IMEDIA-INRIA France Khác
[7] Jhansi Rani S. and V. Vallikumari, 2016, Survey on Content Based Image Retrieval Techniques, International Journal of Trend in Research and Development Khác
[8] JuHanandKai - KuangMa, 2002, Fuzzy Color Histogram and Its Usein Color Image Retrieval, IEEE Transaction on Image Processing Khác
[9] SuhasiniP.S.,K.Sri Rama Krishna,Murali Krishna, 2009, CBIRU sing Color Histogram Processing, Journal of Theoretical and Applied Information Technology Khác
[10] Tamalika Chaira, A.K. Ray, 2005, Fuzzy Measures for Color Image Retrieval, Fuzzy Sets and Systems Khác
[11] Yanmei Liang, Hongchen Zhai, Pierre Chavel, 2002, Fuzzy Color – Image Retrieval, Optics Communications Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w