1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phương pháp tra cứu ảnh dựa trên nội dung và xây dựng hệ thống tra cứu cây thuốc

29 730 2
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu phương pháp tra cứu ảnh dựa trên nội dung và xây dựng hệ thống tra cứu cây thuốc
Tác giả Nguyễn Huy Hoàng
Trường học Học viện Công nghệ Bưu chính Viễn thông
Chuyên ngành Khoa học máy tính
Thể loại Luận văn thạc sĩ
Năm xuất bản 2013
Thành phố Hà Nội
Định dạng
Số trang 29
Dung lượng 708,51 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ý tưởng phương pháp này là trích chọn các đặc điểm dựa vào nội dung trực quan của ảnh như màu sắc, kết cấu, hình dạng và bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp,

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

-

NGUYỄN HUY HOÀNG

NGHIÊN CỨU PHƯƠNG PHÁP TRA CỨU ẢNH DỰA TRÊN NỘI DUNG VÀ XÂY DỰNG HỆ THỐNG TRA

CỨU CÂY THUỐC

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã số: 60.48.01

TÓM TẮT LUẬN VĂN THẠC SĨ

HÀ NỘI – 2013

Trang 2

Luận văn được hoàn thành tại:

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học: ………

Có thể tìm hiểu luận văn tại:

- Thư viện của Học viện Công nghệ Bưu chính Viễn thông

Trang 3

MỤC LỤC

MỞ ĐẦU 4

CHƯƠNG 1 7

TỔNG QUAN VỀ TRA CỨU ẢNH DỰA TRÊN NỘI DUNG (CONTENT-BASED IMAGE RETRIEVAL - CBIR) 7

1.1 Giới thiệu truy vấn ảnh dựa trên nội dung 7

1.2 Mô hình xử lý 8

1.3 Các thành phần chính của một hệ thống CBIR 9

1.4 Các chức năng cơ bản của hệ thống CBIR 10

1.5 Một số hệ thống tra cứu ảnh dựa trên nội 10

1.5.1 Hệ thống QBIC(Query By Image Content)10 1.5.2 Hệ thống Virage 10

1.5.3 Hệ thống RetrievalWare 10

1.5.4 Hệ thống VisualSeek và WebSeek 10

1.5.5 Hệ thống Photobook 10

CHƯƠNG 2 11

PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG ẢNH 11

2.1 Trích chọn đặc trưng ảnh dựa trên màu sắc 11

2.1.1 Lược đồ màu (Histogram) 11

2.1.2 Vector liên kết màu (Color Coherence Vector) 12

2.2 Trích chọn đặc trưng ảnh dựa trên kết cấu 12 2.2.1 Ma trận đồng hiện (Co-occurence Matrix) 13

Trang 4

2.2.2 Phép biến đổi Wavelet 13

2.2.3 Các đặc trưng lọc Gabor 14

2.2.4 Các đặc trưng biến đổi sóng 14

2.3 Trích chọn đặc trưng ảnh dựa trên hình dạng 15

2.3.1 Trích chọn đặc trưng theo biên 15

2.3.1.1 Lược đồ hệ số góc 15

2.3.1.2 Vector liên kết hệ số góc (Edge Direction Coherence Vector) 16

2.3.2 Trích chọn đặc trưng theo vùng 17

2.4 Trích chọn sử dụng điểm nổi bật 17

2.4.1 Đặc trưng cục bộ bất biến (SIFT) 17

2.4.2 SURF 19

CHƯƠNG 3 20

CÀI ĐẶT THỬ NGHIỆM VÀ ỨNG DỤNG 20

3.1 Cài đặt thử nghiệm 20

3.1.1 Môi trường phát triển, cơ sở dữ liệu 20

3.1.2 Phương pháp thực nghiệm 21

3.1.2.1 Lựa chọn mẫu thử nghiệm 21

3.1.2.2 Phương pháp đánh giá 21

3.1.3 Thử nghiệm và kết quả 22

3.1.3.1 Tìm kiếm theo lược đồ màu 22

3.1.3.2 Tìm kiếm theo lược đồ hệ số góc 22

3.1.3.3 Tìm kiếm theo vector liên kết màu 22

3.1.3.4 Tìm kiếm theo AutoCorrelogram 22

Trang 5

3.1.3.5 Tìm kiếm theo các đặc trưng cục bộ bất

biến (SIFT) 22

3.1.3.6 Tìm kiếm với SURF 22

3.1.4 Kết quả thực nghiệm và đánh giá 22

3.2 Ứng dụng tra cứu cây thuốc 24

3.2.1 Phân tích yêu cầu 24

3.2.2 Chức năng ứng dụng 24

3.2.3 Đánh giá ứng dụng 25

KẾT LUẬN 26

Trang 6

MỞ ĐẦU

Cùng với sự phát triển của công nghệ, đã có rất nhiều phương pháp được nghiên cứu để truy vấn thông tin dựa vào hình ảnh Tuy nhiên, một trong những phương pháp được nhiều người quan tâm nghiên cứu hiện nay là phương pháp “Tra cứu ảnh dựa theo nội dung” (Content Based Image Retrieval - CBIR) Ý tưởng phương pháp này là trích chọn các đặc điểm dựa vào nội dung trực quan của ảnh như màu sắc, kết cấu, hình dạng và bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp, tổ chức cơ sở dữ liệu ảnh Tra cứu ảnh dựa trên hình dạng sử dụng các đặc trưng hình dạng của các ảnh mục tiêu để tìm kiếm, nó là một khía cạnh rất quan trọng của tra cứu ảnh dựa trên nội dung Hiện nay có nhiều hệ thống cho phép tra cứu thông tin dựa trên hình ảnh như như Google Image Swirl, Bing, Tiltomo, Tineye, Pixolution…Các hệ thống trên đã đưa ra các kết quả tìm kiếm rất tốt dựa trên ảnh mẫu Tuy nhiên, hạn chế của các hệ thống trên là vẫn tồn tại sự nhập nhằng về dữ liệu, các thông tin chưa cô đọng theo chủ đề xác định, với bài toán đặt ra ở đây là cây thuốc Với mục đích cuối cùng có thể xây dựng được một

Trang 7

hệ thống tra cứu cây thuốc dựa trên hình ảnh Cho phép người Việt Nam nhận biết và sử dụng hiệu quả về các cây thuốc ở Việt Nam thông qua hình ảnh Luận văn này sẽ đi sâu vào những nhiệm vụ chính như sau:

từ đó có thể giới hạn đối tượng làm mẫu và truy vấn

+ Đề xuất sử dụng một số kỹ thuật khác và đưa ra

- Yêu cầu cần giải quyết

+ Tìm hiểu kiến thức về các kỹ thuật xử lý ảnh + Đưa ra được phạm vi đối tượng thực hiện để làm mẫu nhận dạng là lá, cây, hoa, hay tất cả

Trang 8

+ Xây dựng tập mẫu ảnh dựa trên đối tượng đã lựa chọn ở trên

+ Tham khảo các mã nguồn mở về xử lý ảnh cho quá trình cài đặt

+ Nghiên cứu về tra cứu ảnh theo nội dung và các phương pháp trích chọn đặc trưng dựa trên các tài liệu nghiên cứu trước đó Từ đó triển khai cài đặt thuật toán tra cứu

+ Thực nghiệm dựa trên xây dựng và đánh giá các kết quả nghiên cứu

+ Xây dựng hệ thống tra cứu ảnh dựa trên thực nghiệm và các đánh giá đã có

Trang 9

CHƯƠNG 1 TỔNG QUAN VỀ TRA CỨU ẢNH DỰA TRÊN NỘI DUNG (CONTENT-BASED IMAGE

RETRIEVAL - CBIR)

Chương 1 luận văn giới thiệu tổng quan về phương pháp “Tra cứu ảnh dựa theo nội dung - CBIR” bao gồm khái niệm, mục đích, mô hình, thành phần, chức năng và một số hệ thống tra cứu ảnh dự trên nội dung

1.1 Giới thiệu truy vấn ảnh dựa trên nội dung

Tra cứu ảnh dựa theo nội dung (CBIR) có nguồn gốc từ năm 1992 Tra cứu ảnh theo nội dung là tra cứu thông tin trực quan (VIR - Visual Information Retrieval) Các yếu tố trực quan như màu sắc, kết cấu, hình dạng và

bố cục không gian trực tiếp liên quan đến khía cạnh của cảm nhận nội dung ảnh, cùng với các khái niệm ở mức cao như ý nghĩa đối tượng, khung cảnh trong ảnh, được dùng như là manh mối cho tìm kiếm hình ảnh với nội dung tương tự từ cơ sở dữ liệu

Trang 10

• Lập chỉ mục cho CSDL ảnh (Image Indexing)

Từ đó xây dựng nên các thành phần cho hệ thống truy vấn ảnh:

Hệ thống truy vấn ảnh với cơ sở tri thức

Trang 11

1.3 Các thành phần chính của một hệ thống CBIR

Hiện nay, trọng tâm chính của CBIR là nghiên cứu chủ yếu trên 3 chủ đề chính:

Trích chọn đặc trưng: Các đặc trưng của hình ảnh bao gồm các đặc trưng nguyên thủy và các đặc trưng ngữ nghĩa/đặc trưng logic Đặc trưng nguyên thủy như màu sắc, hình dạng, kết cấu và các mối quan hệ không gian được định lượng trong tự nhiên, chúng có thể được trích xuất tự động hoặc bán tự động Đặc trưng logic cung cấp

mô tả trừu tượng của dữ liệu hình ảnh ở các cấp độ khác nhau

Lập chỉ số hiệu quả: Để tạo điều kiện truy vấn hiệu quả và xử lý tìm kiếm, các chỉ số hình ảnh cần thiết được tổ chức thành các cấu trúc dữ liệu hiệu quả Các cấu trúc như k-d-tree, R-tree family, R *- tree, quad-tree, và grid file (tập lưới) thường được sử dụng

Giao diện người dùng: Giao diện người dùng bao gồm một bộ xử lý truy vấn và trình duyệt để cung cấp các công cụ đồ họa tương tác, cơ chế truy vấn và truy cập cơ

sở dữ liệu, theo thứ tự định sẵn

Trang 12

1.4 Các chức năng cơ bản của hệ thống CBIR

Những chức năng chính của một hệ thống bao gồm các nội dung sau:

- Phân tích nội dung của nguồn thông tin và biểu diễn nội dung của các nguồn thông tin

- Phân tích các truy vấn của người dùng và biểu diễn chúng thành các dạng phù hợp với việc đối sánh với

cơ sở sữ liệu nguồn

- Xác định chiến lược để đối sánh tìm kiếm truy vấn với thông tin được lưu trữ trong cơ sở dữ liệu

- Thực hiện các điều chỉnh cần thiết trong hệ thống dựa trên phản hồi từ người sử dụng hoặc những hình ảnh được tra cứu

1.5 Một số hệ thống tra cứu ảnh dựa trên nội

1.5.1 Hệ thống QBIC (Query By Image

Trang 13

CHƯƠNG 2 PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG

ẢNH

Chương 2 sẽ đưa ra một số khái niệm liên quan đến các thuộc tính, kỹ thuật của việc truy vấn theo nội dung ảnh Qua đó làm tiền đề để nghiên cứu xâu hơn các kỹ thuật trích chọn nội dung ảnh và đối sánh ảnh

2.1 Trích chọn đặc trưng ảnh dựa trên màu sắc

2.1.1 Lược đồ màu (Histogram)

Là đại lượng đặc trưng cho phân bố màu cục bộ của ảnh

Độ đo tính tương tự về màu sắc được tính bằng phần giao của 2 lược đồ màu ảnh truy vấn H(IQ) và ảnh trong cơ sở dữ liệu ảnh H(ID) Kết quả sẽ là một lược đồ màu thể hiện độ giống nhau giữa 2 ảnh trên

Tuy nhiên vì lược đồ màu chỉ thể hiện tính phân bố màu toàn cục của ảnh mà không xét đến tính phân bố cục

bộ của điểm ảnh nên có thể có 2 ảnh trông rất khác nhau nhưng lại có cùng lược đồ màu

Trang 14

2.1.2 Vector liên kết màu (Color Coherence Vector)

Là lược đồ tinh chế lược đồ màu, chia mỗi ô màu (bin) thành 2 nhóm điểm ảnh: nhóm liên kết màu (coherence pixels) và nhóm không liên kết màu (non-coherence pixels)

Vector liên kết màu còn giúp giải quyết khuyết điểm về tính không duy nhất của lược đồ màu đối với ảnh Hai ảnh có thể có chung lược đồ màu nhưng khác nhau hoàn toàn, đây là khuyết điểm của lược đồ màu Nhưng với tìm kiếm theo đặc trưng vector liên kết màu thì nó sẽ giải quyết được khuyết điểm không duy nhất này

2.2 Trích chọn đặc trưng ảnh dựa trên kết cấu

Kết cấu hay còn gọi là vân (texture), là một đối tượng dùng để phân hoạch ảnh ra thành những vùng được quan tâm và để phân lớp những vùng đó Vân cung cấp thông tin sự sắp xếp về mặt không gian của màu sắc và cường độ của một ảnh

Ví dụ cấu trúc của vân của một số loại lá cây

Trang 15

Cấu trúc vân của lá cây

2.2.1 Ma trận đồng hiện (Co-occurence

Matrix)

Ma trận đồng hiện là ma trận lưu trữ số lần xuất hiện của những cặp điểm ảnh trên một vùng đang xét Các cặp điểm này được tính theo những quy luật cho trước

Ví dụ với ảnh f như sau:

  1 1 0 01 1 0 0

0 0 2 2  ta có ma trận đồng hiện P(1,0) với

P (1,0)= 4 0 2 2 2 0

0 0 2 

2.2.2 Phép biến đổi Wavelet

Vân thu được từ biến đối wavelet được hầu hết các nghiên cứu công nhận là đặc trưng về vân tốt nhất cho việc phân đoạn ảnh

Trang 16

Thuật toán tính ra các đặc trưng vân theo biến đổi Wavelet:

• Tính biến đổi Wavelet trên toàn ảnh

• Ứng với mỗi vùng cần tính, ta tính được 3 thành phần ứng với các miền HL, LH và HH

• Khi áp dụng biến đổi wavelet ở những mức sâu hơn, ta sẽ có tương ứng 3xV thành phần ứng với V là chiều sâu của biến đổi Wavelet

Có nhiều cách tiếp cận đã được đề xuất để mô tả các kết cấu của các ảnh dựa trên các lọc Gabor

2.2.4 Các đặc trưng biến đổi sóng

Tương tự với lọc Gabor, biến đổi sóng cung cấp một cách tiếp cận đa độ phân giải đối với phân tích kết cấu và phân lớp Các biến đổi sóng phân rã một tín hiệu

Trang 17

2.3 Trích chọn đặc trưng ảnh dựa trên hình dạng

2.3.1 Trích chọn đặc trưng theo biên

2.3.1.1 Lược đồ hệ số góc

Lược đồ gồm 73 phần tử trong đó:72 phần tử đầu chứa số điểm ảnh có hệ số gốc từ 0 – 355 độ, các

hệ số góc này cách nhau 5 độ Phần tử cuối chứa số phần tử không nằm trên biên cạnh

Ảnh minh họa lược đồ hệ số góc

Trang 18

Đường biên của ảnh

2.3.1.2 Vector liên kết hệ số góc (Edge

Direction Coherence Vector)

Là lược đồ tinh chế lược đồ hệ số góc, chia mỗi ô chứa (bin) thành 2 nhóm điển ảnh: Nhóm điểm liên kết hệ

số góc (coherent pixels) và nhóm điểm không liên kết hệ

số góc (non-coherence pixels)

Một pixel trong một ô chứa (bin) được gọi là điểm liên kết hệ số góc (coherent) nếu nó thụôc vùng gồm các điểm thuộc cạnh có hệ số góc tương tự với kích thướt lớn (thường vào khoảng 0.1% kích thước ảnh)

Ảnh minh họa vector liên kết hệ số góc

Trang 19

Ảnh minh họa sự liên kết giữa các biên cạnh

2.3.2 Trích chọn đặc trưng theo vùng

Ảnh gồm tập hợp các vùng hay còn gọi là đoạn Đây là đặc trưng đặc biệt của ảnh Với đặc trưng vùng sẽ giúp cho chúng ta có thể giải quyết được một vấn đề lớn đang cản trở bước phát triển việc truy tìm ảnh dựa vào nội dung là dữ liệu nhập được mô phỏng gần gũi hơn với suy nghĩ của con người và ảnh tìm được có thể mang nội dung ngữ nghĩa rất khác so với ảnh truy vấn

2.4 Trích chọn sử dụng điểm nổi bật

Phương pháp này dựa trên các điểm nổi bật, là các điểm bất biến với sự thay đổi của ảnh như xoay, co giãn, che lấp một phần… Có 2 phương pháp tiêu biểu nhất là SIFT và SURF

2.4.1 Đặc trưng cục bộ bất biến (SIFT)

Trang 20

SIFT là viết tắt của cụm từ Scale-Invariant Feature

Transform là một trong những thuật toán nổi ti

hiện nay dùng để phát hiện và mô tả các đặc trưng c

số Thuật toán này được công bố bởi David Lowe vnăm 1999[19]

Hai hình trên có thể được nhận ra là củ

cảnh bởi SIFT

Giống như nhiều thuật toán về xử lý ảnh, SIFT lthuật toán khá phức tạp, phải trải qua nhiều bướ

sử dụng nhiều kiến thức về toán học Sau đây s

bước chính trong thuật toán:

1 Xây dựng không gian scale

2 Xác đinh vị trí điểm đặc trưng

3 Thêm hướng cho điểm đặc trưng

4 Mô tả điểm đặc trưng

Invariant Feature

ổi tiếng nhất ưng của ảnh

i David Lowe vào

ủa cùng 1

ảnh, SIFT là

ớc xử lý và đây sẽ là các

Trang 21

2.4.2 SURF

SURF (Speeded Up Robust Features) được giới thiệu lần đầu tiên vào năm 2006 bởi nhóm các nhà nghiên cứu bao gồm Herbert Bay, Tinne Tuytelaars và Luc Van Gool Cách tiếp cận của phương pháp này tương đối giống với SIFT SURF cũng sử dụng không gian scale để tìm điểm đặc trưng, các đặc trưng được mô tả dưới dạng vector và có kèm thêm hướng Hai phần chính trong thuật toán này là “phát hiện” (detection) và “mô tả” (description)

Phát hiện : Việc phát hiện đặc trưng dựa trên

không gian scale và sử dụng ma trận Hessian, tuy nhiên để đơn giản cho việc tính toán người ta chỉ sử dụng một xấp

xỉ của ma trận này

Mô tả : Việc mô tả đặc trưng sử dụng đặc trưng

Haar Wavelet Một lần nữa Integral Images lại được sử dụng để tăng tốc độ tính toán Mỗi điểm đặc trưng sẽ được thêm 1 hướng dùng để nhận dạng khi ảnh bị xoay.Mô tả điểm đặc trưng được thể hiện dưới dạng vector gồm 64 thành phần

Trang 22

CHƯƠNG 3 CÀI ĐẶT THỬ NGHIỆM VÀ ỨNG DỤNG

Trong chương này, luận văn sẽ cài đặt một số thuật toán trích chọn dựa trên đặc trưng ảnh, từ đó đưa ra đánh giá về các kỹ thuật Chọn kỹ thuật tối ưu để xây dựng hệ thống tra cứu cây thuốc

3.1 Cài đặt thử nghiệm

3.1.1 Môi trường phát triển, cơ sở dữ liệu

Chương trình được thiết kế trên Visual Studio

2010, ngôn ngữ C# (C Sharp) và CSDL SQL Server 2008 Chương trình cũng có sử dụng một số thư viện hỗ trợ xử

lý ảnh như EmguCV.dll, AForge.dll và một số thư viện hỗ trợ khác tham khảo qua internet

Dữ liệu mẫu từ chương trình

Trang 23

3.1.2 Phương pháp thực nghiệm

3.1.2.1 Lựa chọn mẫu thử nghiệm

Hiệu quả hoạt động của hệ thống được đánh giá bằng cách chạy thử nghiệm trên cơ sở dữ liệu hình ảnh đã

Để trực quan hơn em có sử dụng thêm biểu đồ thời gian và biểu đồ độ chính xác trung bình (xác suất số lần xuất hiện kết quả đúng trong top-N với 10 lần thử nghiệm)

Trang 24

3.1.3 Thử nghiệm và kết quả

Chương trình tiến hành thử nghiệm và lấy số liệu với từng trường hợp cụ thể bao gồm:

3.1.3.1 Tìm kiếm theo lược đồ màu

3.1.3.2 Tìm kiếm theo lược đồ hệ số góc 3.1.3.3 Tìm kiếm theo vector liên kết màu 3.1.3.4 Tìm kiếm theo AutoCorrelogram 3.1.3.5 Tìm kiếm theo các đặc trưng cục bộ bất biến (SIFT)

3.1.3.6 Tìm kiếm với SURF

3.1.4 Kết quả thực nghiệm và đánh giá

Từ những kết kết quả thử nghiệm cho thấy rằng các kết quả trích chọn dựa trên màu sắc là tốt nhất, tiếp theo kết cấu và hình dạng, và hiệu suất của hệ thống được tăng lên khi kết hợp một số phương pháp lại với nhau

Phương pháp truy vấn dựa trên màu sắc là chiếm

ưu thể hơn cả Cả về thời gian tính toán cũng như số lượng các kết quả chính xác, có độ tương đồng cao

Ngày đăng: 17/02/2014, 08:47

HÌNH ẢNH LIÊN QUAN

Hình 3.4: Chức năng tìm kiếm cây thuốc - Nghiên cứu phương pháp tra cứu ảnh dựa trên nội dung và xây dựng hệ thống tra cứu cây thuốc
Hình 3.4 Chức năng tìm kiếm cây thuốc (Trang 26)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w