1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tra cứu địa danh du lịch dựa vào hình ảnh

61 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 61
Dung lượng 1,06 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ý tưởng phương pháp này là trích chọn các đặc điểm dựa vào nội dung trực quan của ảnh như màu sắc, kết cấu, hình dạng và bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp,

Trang 1

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

KHUẤT DUY TOÀN

TRA CỨU ĐỊA DANH DU LỊCH

DỰA VÀO HÌNH ẢNH

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: PGS TS Đỗ Năng Toàn

Trang 2

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

THÁI NGUYÊN - 2013

Trang 3

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

LỜI CAM ĐOAN

Tôi xin cam đoan toàn bộ nội dung bản luận văn này là do tôi tự sưu tầm, tra cứu và sắp xếp cho phù hợp với nội dung yêu cầu của đề tài

Nội dung luận văn này chưa từng được công bố hay xuất bản dưới bất kỳ hình thức nào và cũng không được sao chép từ bất kỳ một công trình nghiên cứu nào

này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc

Nếu sai tôi xin hoàn toàn chịu trách nhiệm

Thái Nguyên, ngày 10 tháng 10 năm 2013

Tác giả luận văn

Khuất Duy Toàn

Trang 4

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

LỜI CẢM ƠN

Trong quá trình thực hiện luận văn này, em luôn nhận được sự hướng dẫn, chỉ

bảo tận tình của PGS TS Đỗ Năng Toàn, Viện Công nghệ Thông tin thuộc Viện

Khoa học và Công nghệ Việt Nam là cán bộ trực tiếp hướng dẫn khoa học cho em

Em xin chân thành cảm ơn sự giúp đỡ quý báu đó

Em xin chân thành cảm ơn các Thầy, Cô giáo trong khoa Công nghệ thông tin và các cán bộ, nhân viên phòng Đào tạo Sau đại học, trường Đại học công nghệ thông tin và Truyền thông cùng các anh chị đồng nghiệp trong cơ quan đã tạo những điều kiện thuận lợi cho em học tập và nghiên cứu tại trường Đại học công nghệ thông tin và Truyền thông

Xin chân thành cảm ơn các anh, chị và các bạn học viên lớp Cao học K10B - trường Đại học công nghệ thông tin và Truyền thông đã luôn động viên, giúp đỡ và nhiệt tình chia sẻ với em những kinh nghiệm học tập, công tác trong suốt khoá học

Cuối cùng, tôi muốn gửi lời cảm ơn vô hạn tới gia đình và bạn bè, những người thân yêu luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp

Mặc dù rất cố gắng, song luận văn này không thể tránh khỏi những thiếu sót, kính mong được sự chỉ dẫn của các quý thầy cô và các bạn

Thái Nguyên, ngày 10 tháng 10 năm 2013

Tác giả luận văn

Khuất Duy Toàn

Trang 5

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

MỤC LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

MỤC LỤC iii

DANH MỤC HÌNH ẢNH v

MỞ ĐẦU 1

Chương 1: KHÁI QUÁT VỀ TRA CỨU ẢNH VÀ BÀI TOÁN TRA CỨU ĐỊA DANH DU LỊCH 5

1.1 Khái quát về tra cứu ảnh 5

1.1.1 Xử lý ảnh là gì 5

1.1.2 Một số khái niệm trong xử lý ảnh 7

1.1.3 Một số phương pháp biểu diễn ảnh 7

1.1.4 Phương pháp phát hiện biên ảnh 9

1.1.5 Phân vùng ảnh 10

1.1.6 Một số phương pháp tra cứu ảnh 14

1.2 Bài toán tra cứu địa danh du lịch 17

1.2.1 Địa danh du lịch 17

1.2.2 Đặc trưng của địa danh du lịch và ảnh địa danh du lịch 17

1.2.3 Ứng dụng của kỹ thuật tra cứu ảnh vào bài toán tra cứu địa danh du lịch 17

Chương 2: MỘT SỐ KỸ THUẬT TRA CỨU ĐỊA DANH DU LỊCH QUA ẢNH 19 2.1 Kỹ thuật tra cứu ảnh theo nội dung 19

2.2 Kỹ thuật tra cứu ảnh dựa vào màu sắc 21

2.2.1 Không gian màu 22

2.2.2 Các moment màu 23

2.2.3 Lược đồ màu (histogram màu) 24

2.2.4 Véc tơ gắn kết màu 26

2.2.5 Sơ đồ tương quan màu 26

Trang 6

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

2.2.6 Các đặc điểm bất biến màu 27

2.3 Kỹ thuật tra cứu ảnh dựa vào hình dạng 28

2.3.1 Biên và các phương pháp phát hiện biên 29

2.3.2 Xử lý ảnh trong miền tần số và biến đổi Fourier [3, 4, 5] 32

2.3.3 Mô tả Fourier 36

2.3.4 Các bất biến moment 38

2.3.5 Các hàm xoay/góc xoay 39

2.3.6 Độ tròn, độ lệch tâm và hướng trục chính 40

Chương 3:CHƯƠNG TRÌNH THỬ NGHIỆM 41

3.1 Giới thiệu bài toán tra cứu địa danh du lịch qua ảnh 41

3.2 Phấn tích bài toán 42

3.3 Xây dựng chương trình 43

3.3.1 Sơ đồ khối tổng quát 43

3.3.2 Tra cứu theo màu sắc 44

3.3.3 Sử dụng chương trình ứng dụng 45

3.4 Khả năng mở rộng của chương trình 47

3.4.1 Những hạn chế của chương trình 47

3.4.2 Khả năng mở rộng 47

KẾT LUẬN 48

TÀI LIỆU THAM KHẢO 50

PHỤ LỤC 51

Trang 7

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

DANH MỤC HÌNH ẢNH

Hình 1.1 Các bước cơ bản trong xử lý ảnh 6

Hình 1.2 Hướng các điểm biên và mã tương ứng 8

Hình 1.3 Lược đồ rắn lượn và cách chọn ngưỡng 11

Hình 1.4 Minh họa khái niệm liên thông 13

Hình 2.1 Ví dụ về một số lọai kết cấu 20

Hình 2.2 Mô hình hệ thống Tra cứu ảnh theo nội dung 21

Hình 2.3 Biểu diễn hình dạng theo đường biên và theo vùng 29

Hình 2.4 Minh họa xác định điểm biên 30

Hình 2.5 Miền thời gian và miền tần số 33

Hình 2.6 Ảnh thực (a) và ảnh thu được sau biến đổi Fourier (b) 35

Hình 3.1 Sơ đồ khối tổng quát của chương trình 43

Hình 3.2 Sơ đồ khối phần tra cứu ảnh theo màu sắc 44

Hình 3.3 Giao diện của chương trình 45

Hình 3.4 Một số kết quả chạy chương trình 47

Trang 8

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Tuy nhiên khi số lượng ảnh được lưu trữ trở nên rất lớn thì vấn đề là phải có những phương pháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tìm kiếm, tra cứu ảnh hiệu quả, có độ chính xác cao và có hiệu năng tốt

Việc tìm kiếm được một bức ảnh mong muốn trong hàng triệu bức ảnh thuộc

đủ loại chủ đề khác nhau là rất khó khăn

Khi số lượng ảnh trong một bộ sưu tập còn ít, việc nhận diện một bức ảnh hay việc so sánh sự giống và khác nhau giữa nhiều bức ảnh có thể thực hiện được bằng mắt thường, tuy nhiên khi có số lượng rất lớn ảnh thì việc so sánh bằng mắt thường là rất khó khăn, đòi hỏi phải có những phương pháp hiệu quả

và chính xác hơn

Trong thực tế, bài toán tra cứu ảnh số có rất nhiều ứng dụng quan trọng Ví dụ như trong lĩnh vực ngân hàng việc so sánh chữ ký của khách hàng với mẫu chữ ký đã được lưu trữ sẵn có thể thực hiện rất nhanh và chính xác nếu có được một phần mềm so sánh mẫu chữ ký tốt Thực tế hiện nay tại các ngân hàng ở Việt nam người ta vẫn phải

sử dụng phương pháp so sánh bằng mắt thường vì việc so sánh chữ ký bằng phần mềm

Trang 9

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

vẫn chưa thực hiện được Một ví dụ khác là bài toán quản lý biểu trưng (logo) trong lĩnh vực sở hữu trí tuệ Khi một đơn vị muốn đăng ký logo riêng cho đơn vị của mình thì cơ quan quản lý phải tiến hành đánh giá xem mẫu logo đó đã được sử dụng hay chưa hoặc có tương tự với mẫu logo nào đó đang được sử dụng hay không Trong trường hợp này nếu sử dụng mắt thường để duyệt thì sẽ tốn rất nhiều thời gian, nếu có các phần mềm cho phép tìm kiếm trong cơ sở dữ liệu ảnh có sẵn những biểu trưng tương tự với biểu trưng mẫu thì việc đánh giá sự tương tự sẽ dễ dàng hơn nhiều

Các ứng dụng phức tạp hơn như so sánh mẫu vân tay, tìm kiếm ảnh tội phạm v.v là những bài toán tra cứu ảnh được áp dụng trong ngành khoa học hình sự

Ngoài ra các lĩnh vực ở trên ra thì các đối tượng được nhận dạng, tra cứu có nhiều kiểu như tiếng nói, chữ viết, khuôn mặt, mã vạch … và trong lĩnh vực du lịch thì việc tra cứu các địa danh du lịch cũng là một vấn đề được quan tâm Đây là kiểu đối tượng có tính chất đặc trưng về hình dạng và màu sắc, thường bắt gặp trong đời sống hằng ngày với công dụng là đưa ra những địa danh du lịch theo nhu cầu và sở thích của du khách Tuy nhiên các địa danh du lịch thì không có quy luật mà chỉ là

hệ thống các hình ảnh với ý nghĩa qui ước kèm theo Việc ghi nhớ hình dạng và ý nghĩa của tất cả các loại ảnh đối với chúng ta sẽ là một khó khăn lớn, do đó chúng ta thường hay có nhu cầu tra cứu tìm hiểu trực quan Bởi vậy việc xây dựng một chương trình nhằm phát hiện và nhận dạng các loại địa danh du lịch cho phép người dùng có thể tra cứu trực quan thông tin của địa danh đó Nhằm đạt được điều đó đòi hỏi phải sử dụng tới các kỹ thuật nhận dạng và tra cứu ảnh Chính vì vậy mà tôi

chọn đề tài “Tra cứu địa danh du lịch dựa vào hình ảnh”

Vấn đề này chính là động lực để tôi tìm hiểu các phương pháp tra cứu ảnh số đang được ứng dụng nhiều trong thực tế và tìm kiếm phương pháp phù hợp nhất để giải quyết bài toán này

Trước năm 1990, người ta thường sử dụng phương pháp tra cứu ảnh theo văn bản (Text Based Image Retrieval) Theo cách này người ta sẽ gán cho mỗi bức ảnh một lời chú thích phù hợp với nội dung hoặc một đặc điểm nào đó của ảnh, sau đó

Trang 10

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

việc tra cứu ảnh được thực hiện dựa trên những lời chú thích này Phương pháp này khá đơn giản, tuy nhiên lại không thể áp dụng để tra cứu các cơ sở dữ liệu ảnh có số lượng ảnh lớn và kết quả tra cứu thì mang tính chủ quan và cảm ngữ cảnh

Một trong những phương pháp được nhiều người quan tâm nghiên cứu hiện nay là phương pháp “Tra cứu ảnh dựa theo nội dung” (Content Based Image Retrieval) Ý tưởng phương pháp này là trích chọn các đặc điểm dựa vào nội dung trực quan của ảnh như màu sắc, kết cấu, hình dạng và bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp, tổ chức cơ sở dữ liệu ảnh

Một số hệ thống tra cứu ảnh nổi tiếng như QBIC (IBM), Virage (Virage Inc.), Photobook (MIT), VisualSEEK (Columbia University) đã áp dụng khá thành công phương pháp tra cứu này

Trên cơ sở của phương pháp tra cứu ảnh theo nội dung người ta còn tìm cách

bổ sung, cải tiến để cho ra đời một số phương pháp tra cứu ảnh khác như tra cứu ảnh theo bản thể, tra cứu ảnh theo đồ thị, tra cứu ảnh theo nhận thức v.v

Nội dung của đề tài này giới thiệu cơ sở lý thuyết và các ứng dụng chính của một số phương pháp tra cứu ảnh, trong đó đi sâu vào giới thiệu phương pháp tra cứu ảnh theo nội dung Trên những cơ sở đó tiến hành thử nghiệm một phương pháp cụ thể xây dựng một chương trình phần mềm tra cứu địa danh du lịch cho phép đọc vào một ảnh mẫu và tìm kiếm những ảnh tương tự với ảnh mẫu trong một tập hợp các ảnh cho trước theo hai đặc điểm là hình dạng và màu sắc của ảnh

Bố cục của luận văn gồm Phần mở đầu, Phần kết luận và 3 chương nội dung cùng với tài liệu tham khảo, cụ thể

Chương 1: Khái quát về tra cứu ảnh và bài toán tra cứu địa danh du lịch

Giới thiệu đầy đủ về các kiến thức nền tảng được sử dụng trong khóa luận bao gồm kiến thức về xử lý ảnh và giới thiệu về bài toán tra cứu địa danh du lịch

Chương 2: Một số kỹ thuật tra cứu địa danh du lịch qua ảnh

Trình bày hai kỹ thuật tra cứu địa danh du lịch là kỹ thuật tra cứu ảnh dựa vào màu sắc và kỹ thuật tra cứu ảnh dựa vào hình dạng

Trang 11

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Chương 3: Chương trình thử nghiệm

Xây dựng một ứng dụng của phương pháp tra cứu ảnh theo nội dung áp dụng vào bài toán tra cứu địa danh du lịch qua ảnh, các sơ đồ chức năng và thiết kế giao diện của chương trình, những hạn chế và khả năng mở rộng của chương trình

Trang 12

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Chương 1:

KHÁI QUÁT VỀ TRA CỨU ẢNH

VÀ BÀI TOÁN TRA CỨU ĐỊA DANH DU LỊCH

1.1 Khái quát về tra cứu ảnh

Những năm gần đây, vấn đề tra cứu ảnh số nhận được sự quan tâm ngày càng lớn Nguyên nhân một phần là do sự phát triển của công nghệ chế tạo thiết bị thu nhận và lưu trữ ảnh số cũng như sự phát triển mạnh mẽ của mạng Internet Người sử dụng trong nhiều lĩnh vực khác nhau có cơ hội để truy cập và sử dụng các kho lưu trữ ảnh thuộc đủ loại chủ đề và với nhiều kiểu định dạng ảnh khác nhau Tuy nhiên người ta cùng nhận thấy rằng việc tìm được một bức ảnh mong muốn trong bộ sưu tập ảnh đa dạng có kích thước lớn là rất khó khăn

Tra cứu ảnh là một quá trình tìm kiếm trong một cơ sở dữ liệu ảnh những ảnh thoả mãn một yêu cầu nào đó Ví dụ, người sử dụng có thể tìm kiếm tất cả các ảnh về chủ đề về biển trong một cơ sở dữ liệu ảnh hoặc một người sử dụng khác lại muốn phân loại cơ sở ảnh của mình thành các bộ sưu tập có chủ đề khác nhau Một

ví dụ khác về tra cứu ảnh là một người muốn tìm tất cả các ảnh tương tự với một bức ảnh mẫu nào đó trong một cơ sở dữ liệu ảnh

Vấn đề tra cứu ảnh đã được nhìn nhận rộng rãi và việc tìm kiếm các giải pháp cho vấn đề này trở thành một lĩnh vực rất sôi động, thu hút sự quan tâm của nhiều nhà nghiên cứu và phát triển

1.1.1 Xử lý ảnh là gì

Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống

Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy

Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm

Trang 13

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận

Có thể hiểu một cách khác, xử lý ảnh hay cao cấp hơn nữa là thị giác máy tính (Computer Vision) bao gồm tất cả các lý thuyết và kỹ thuật liên quan, cho phép tạo lập một hệ thống có khả năng tiếp nhận thông tin từ các hình ảnh thu được, lưu trữ và xử lý theo nhu cầu

Hình 1.1 Các bước cơ bản trong xử lý ảnh

Thu nhận ảnh: Quá trình tiếp nhận thông tin từ vật thể thông qua camera màu hoặc trắng đen, ảnh thu nhận được có thể là ảnh tương tự hoặc ảnh đã

số hóa

Tiền xử lý ảnh: Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử

lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn

Phân đoạn ảnh: Là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong

bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này

Biểu diễn ảnh: Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc

Trang 14

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm

cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác

Nhận dạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu)

từ trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại

1.1.2 Một số khái niệm trong xử lý ảnh

Ảnh và điểm ảnh: Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian

và độ sáng Để xử lý bằng máy tính, ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh và ảnh được xem như là 1 tập hợp các điểm ảnh

Độ phân giải của ảnh: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị

Mức xám của ảnh: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó Giá trị mức xám thông thường: 16, 32, 64, 128, 256

Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau

Ảnh nhị phân: là ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả

21 mức khác nhau Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể

là 0 hoặc 1

1.1.3 Một số phương pháp biểu diễn ảnh

Sau khi thu nhận và số hóa, ảnh sẽ được lưu trữ hay chuyển sang giai đoạn phân tích Trước khi đề cập đến vấn đề lưu trữ ảnh, cần xem xét ảnh sẽ được biểu

Trang 15

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

diễn ra sao trong bộ nhớ máy tính

1.1.3.1 Mã loạt dài

Mã loạt dài (Run-length Code) hay dùng để biểu diễn cho vùng ảnh hay ảnh nhị phân Một vùng ảnh R có thể biểu diễn đơn giản nhờ một ma trận nhị phân:

Với các biểu diễn trên, một vùng ảnh hay ảnh nhị phân đựoc xem như chuỗi

0 hay 1 đan xen Các chuỗi này được gọi là mạch (run) Theo phương pháp này, mỗi mạch sẽ được biểu diễn bởi địa chỉ bắt đầu của mạch và chiều dài mạch theo dạng {<hàng,cột>, chiều dài}

1.1.3.2 Mã xích

Mã xích thường được dùng để biểu diễn biên của ảnh Thay vì lưu trữ toàn

bộ ảnh, người ta lưu trữ dãy các điểm ảnh như A, B…M Theo phương pháp này, 8 hướng của vectơ nối 2 điểm biên liên tục được mã hóa Khi đó ảnh được biểu diễn qua điểm ảnh bắt đầu A cùng với chuỗi các từ mã Điều này được minh họa trong hình dưới đây:

Hình 1.2 Hướng các điểm biên và mã tương ứng

1.1.3.3 Mã tứ phân

Theo phương pháp mã tứ phân, một vùng ảnh coi như bao kín một hình chứ

Trang 16

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

nhật Vùng này được chia làm 4 vùng con (Quadrant) Nếu một vùng con gồm toàn điểm đen (1) hay toàn điểm trắng (0) thì không cần chia tiếp Trong trường hợp ngược lại, vùng con gồm cả điểm đen và trắng gọi là vùng không đồng nhất, ta tiếp tục chia thành 4 vùng con tiếp và kiểm tra tính đồng nhất của các vùng con đó Quá trình chia dừng lại khi mỗi vùng con chỉ chứa thuần nhất điểm đen hoặc điểm trắng Quá trình đó tạo thành một cây chia theo bốn phần gọi là cây tứ phân Như vậy, cây biểu diễn ảnh gồm một chuỗi các ký hiệu b (black), w (white) và g (grey) kèm theo

ký hiệu mã hóa 4 vùng con Biểu diễn theo phương pháp này ưu việt hơn so với các phương pháp trên, nhất là so với mã loạt dài Tuy nhiên, để tính toán số đo các hình như chu vi, mô men là tương đối khó khăn

1.1.4 Phương pháp phát hiện biên ảnh

Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột ngột về mức xám (hoặc màu) Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên nếu lân cận nó có ít nhất một điểm trắng

Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành một đường biên hay đường bao

Ý nghĩa của đường biên: đường biên là một loại đặc trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh Nngười ta sử dụng biên làm phân cách các vùng xám (màu) cách biệt

1.1.4.1 Phát hiện biên trực tiếp

Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là kỹ thuật lấy đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có các kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh

ta có kỹ thuật Laplace Ngoài ra còn có một số cách tiếp cận khác

1.1.4.2 Phát hiện biên gián tiếp

Nếu bằng cách nào đấy, chúng ta thu đượng các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là biên Nói cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã được phân vùng Phương pháp dò biên

Trang 17

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên độ sáng nhỏ Để có thể tiến hành xác định biên theo cách gián tiếp này, chúng ta cần giải quyết được bài toán phân vùng ảnh

1.1.5 Phân vùng ảnh

Phân vùng ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám…

Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó : mức xám, mức màu, độ nhám… Vùng ảnh là một trong hai thuộc tính của ảnh Nói đến vùng ảnh là nói đến tính chất bề mặt Đường bao quanh một vùng ảnh (Boundary) là biên ảnh Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng

Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng : phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền

kề, phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu

1.1.5.1 Phân vùng theo ngưỡng biên độ

Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ của các tính chất vật lý của ảnh như: độ tương phản, độ truyền sáng, màu sắc hoặc quang phổ

Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao Kỹ thuật phân ngưỡng theo biên độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang

Việc chọn ngưỡng rất quan trọng Nó bao gồm các bước :

Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể dùng để chọn ngưỡng

Trang 18

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Chọn ngưỡng t sao cho một phần xác định trước η của toàn bộ số mẫu là thấp hơn t Điều chỉnh ngưỡng dựa trên lược đồ xám của các điểm lân cận

Chọn ngưỡng theo lược đồ xám của những điểm thỏa mãn tiêu chuẩn chọn Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc

Ta xét ví dụ sau về việc phân vùng dựa trên ngưỡng biên độ:

Hình 1.3 Lược đồ rắn lượn và cách chọn ngưỡng

Giả sử ảnh có lược đồ xám và cách chọn các ngưỡng như hình trên với: T0=Lmin, …, T4=Lmax Ta có 5 ngưỡng và phân ảnh thành 4 vùng, ký hiệu Ck là vùng thứ k của ảnh, k=1,2,3,4 Cách phân vùng theo nguyên tắc :

P(m,n) ∈ Ck nếu Tk-1 ≤ P(m,n) < Tk , k=1,2,3,4

Khi phân vùng xong, nếu ảnh rõ nét thì việc phân vùng coi như kết thúc Nếu không, cần điều chỉnh ngưỡng

1.1.5.2 Phân vùng theo miền đồng nhất

Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động

Trang 19

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là : Phương pháp tách cây tứ phân

Phương pháp cục bộ

Phương pháp tổng hợp

Phương pháp tách cây tứ phân

Về nguyên tắc, phương pháp này kiểm tra tính đúng đắn của tiêu chuẩn đề ra một cách tổng thể trên miền lớn của ảnh Nếu tiêu chuẩn được thỏa mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn Với mỗi miền nhỏ, áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều thỏa mãn điều kiện

Phương pháp này có thể mô tả bằng thuật toán sau :

Tiêu chuẩn xét miền đồng nhất ở đây có thể dựa vào mức xám Ngoài ra, có thể dựa vào độ lệch chuẩn hay độ chênh giữa giá trị mức xám lớn nhất và giá trị mức xám nhỏ nhất Giả sử Max và Min là giá trị mức xám lớn nhất và nhỏ nhất trong miền đang xét

Nếu |Max – Min| < T (ngưỡng) ta coi miền đang xét là đồng nhất Trường hợp ngược lại, miền đang xét không là miền đồng nhất và sẽ được chia làm 4 phần

Phương pháp cục bộ

Ý tưởng của phương pháp là xét ảnh từ các miền nhỏ nhất rồi nối chúng lại nếu thỏa mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Tiếp tục với các miền thu được cho đến khi không thể nối thêm được nữa Số miền còn lại cho ta kết

Trang 20

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

quả phân đoạn Như vậy, miền nhỏ nhất của bước xuất phát là điểm ảnh

Phương pháp này hoàn toàn ngược với phương pháp tách Song điều quan trọng

ở đây là nguyên lý nối 2 vùng Việc nối 2 vùng được thực hiện theo nguyên tắc sau :

Hai vùng phải đáp ứng tiêu chuẩn, thí dụ như cùng màu hay cùng mức xám Hai vùng phải kế cận nhau

Trong xử lý ảnh, người ta dùng khái niệm liên thông để xác định tính chất kế cận

Có hai khái niệm về liên thông là 4 liên thông và 8 liên thông Với 4 liên thông một điểm ảnh I(x,y) sẽ có 4 kế cận theo 2 hướng x và y ; trong khi đó với 8 liên thông, điểm I(x,y)

sẽ có 4 liên thông theo 2 hướng x, y và 4 liên thông khác theo hướng chéo 45o

Hình 1.4 Minh họa khái niệm liên thông

Dựa theo nguyên lý của phương pháp nối, ta có 2 thuật toán :

Thuật toán tô màu (Blob Coloring): sử dụng khái niệm 4 liên thông, dùng một cửa sổ di chuyển trên ảnh để so sánh với tiêu chuẩn nối

Thuật toán đệ quy cục bộ: sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng

Trang 21

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Vì nhược điểm này, người ta nghĩ đến phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng từ gốc đến lá Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu chuẩn Với phương pháp này ta thu được một cấu trúc ảnh với các miền liên thông có kích thước tối đa

1.1.5.3 Phân vùng theo kết cấu bề mặt

Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải vóc… Kết cấu là thuật ngữ phản ánh sự lặp lại của các phần tử sợi (texel) cơ bản

Sự lặp lại này có thể ngẫu nhiên hay có tính chu kì hoặc gần chu kì Một texel chứa rất nhiều điểm ảnh Trong phân tích ảnh, kết cấu được chia làm hai loại chính là: loại thống kê và loại cấu trúc

Khi đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa vào tính kết cấu trở nên quan trọng Nguyên nhân là kết cấu sợi thường chứa mật độ cao các gờ (edge) làm cho phân đoạn theo biên kém hiệu quả, trừ phi ta loại tính kết cấu

Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức tạp Trong thực tế, chúng ta thường chỉ giải quyết vấn đề này bằng cách cho biết trước các loại kết cấu (dựa vào quy luật hay các phân bố của nó)

1.1.6 Một số phương pháp tra cứu ảnh

Phần sau đây giới thiệu sơ lược một số mốc phát triển quan trọng của phương pháp tra cứu ảnh theo nội dung và một số phương pháp tra cứu ảnh cải tiến đang được áp dụng trong các hệ thống tra cứu ảnh

1.1.6.1 Tra cứu ảnh theo nội dung [1, 6, 12]

Một số hệ thống tra cứu ảnh theo nội dung tiêu biểu:

QBIC hay Query By Image Content do hãng IBM và Trung tâm nghiên cứu Almaden hợp tác phát triển Hệ thống này cho phép truy vấn dựa trên nhiều thuộc tính trực quan như màu sắc, kết cấu và hình dạng của đối tượng ảnh QBIC hỗ trợ các kiểu truy vấn dựa trên ảnh mẫu, dựa trên hình phác thảo hoặc dựa trên các mẫu

Trang 22

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

màu hoặc mẫu kết cấu

VIR Image Engine do Công ty Virage Inc phát triển, cũng giống như QBIC, hệ thống này cho phép tra cứu ảnh dựa trên các thuộc tính màu sắc, kết cấu và cấu trúc

VisualSEEK và WebSEEK do trường Đại học Tổng hợp Columbia (Mỹ) phát triển Cả hai hệ thống này đều hỗ trợ các cách tìm kiếm theo màu sắc, kết cấu

và bố cục không gian

NeTra do trường Đại học Tổng hợp California (Mỹ) phát triển Hệ thống này

hỗ trợ tìm kiếm theo màu sắc, hình dạng, bố cục không gian và kết cấu cũng như theo sự phân mảnh của ảnh

MARS hay Multimedia Analysis and Retrieval System do trường Đại học Tổng hợp Illinois phát triển, hỗ trợ tìm kiếm theo màu sắc, bố cục không gian, kết cấu và hình dạng

Viper hay Visual Information Processing for Enhanced Retrieval do trường Đại học Geneva phát triển, tìm kiếm theo màu sắc và kết cấu

1.1.6.2 Tra cứu ảnh theo bản thể [8,12]

Giới thiệu

Các phương pháp tìm kiếm theo từ khoá có rất nhiều hạn chế: một từ khoá trong văn bản không chỉ ra được văn bản đó có thích hợp hay không và các văn bản thích hợp lại có thể không chứa một từ khoá nhất định Các từ đồng nghĩa làm giảm

độ thu hồi, các từ đồng âm làm giảm độ chính xác và các quan hệ ngữ nghĩa như quan hệ thượng hạ vị, trái nghĩa, phản nghĩa chưa được đề cập đến

Công nghệ web ngữ nghĩa (semantic web) hứa hẹn có thể giải quyết được những khó khăn trên

Chú giải ngữ nghĩa

Các cách tiếp cận sau thường được sử dụng để chú giải ảnh:

- Từ khoá: danh sách các từ được phép sử dụng để chú giải ảnh được hạn chế làm cho việc tìm kiếm dễ dàng hơn

- Phân loại: có nhiều hệ thống phân loại có khả năng phân loại theo nhiều

Trang 23

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

phương diện khác nhau thành các cây phân cấp theo chủ đề Một ảnh có thể chú thích bằng một tập các chủ đề mô tả ảnh đó Ví dụ, ảnh trên một chiếc phong bì vẽ một toà lâu đài có thể liên quan tới lớp “phong bì” và lớp “lâu đài”

- Mô tả ảnh: Sử dụng những câu mô tả các đối tượng ảnh có trong ảnh Hệ thống tra cứu thông tin có nhiệm vụ đánh chỉ số các văn bản này để có thể tìm kiếm bằng từ khoá

Tra cứu ảnh ngữ nghĩa

Các bản thể tạo thành hạt nhân của của các hệ thống tra cứu ảnh ngữ nghĩa được sử dụng cho ba mục đích:

Thuật ngữ chú giải: mô hình bản thể cung cấp thuật ngữ và các khái niệm để diễn tả dữ liệu về dữ liệu (metadata) của các ảnh

Tìm kiếm theo cách nhìn: các bản thể của một mô hình, chẳng hạn Sự kiện, Con người hoặc Vị trí cho ta các cách nhìn khác nhau vào cùng một nội dung giới thiệu Mỗi cách nhìn bao gồm các lớp và các trường hợp ví dụ biểu diễn bằng metaphor của một trình duyệt hệ thống file trong đó các lớp tương ứng với các thư mục và các trường hợp ví dụ tương ứng với các file

Duyệt ngữ nghĩa: Sau khi tìm kiếm được tâm điểm chú ý là một ảnh nào đó,

mô hình bản thể ngữ nghĩa cùng với dữ liệu ảnh ví dụ có thể được sử dụng để tìm ra mối quan hệ giữa ảnh được lựa chọn và các ảnh trong cơ sở dữ liệu ảnh Các ảnh này sẽ được đưa ra cho người sử dụng chọn Những ảnh đó có thể không phù hợp hoàn toàn với truy vấn nhưng nói chung là tương đối phù hợp

1.1.6.3 Tra cứu ảnh theo đồ thị

Động lực của phương pháp này dựa trên một thực tế là những ảnh thích hợp

về mặt trực giác thường không có chung những đặc điểm mức thấp nhưng vẫn có sự tương tự về mặt khái niệm và về mặt ngữ cảnh đối với con người Ví dụ, những ảnh chụp người trong bộ đồ tắm thường có màu sắc, hình dạng và kết cấu rất đa dạng nhưng về mặt khái niệm thì lại được con người cảm nhận là tương tự nhau

Vì vậy phương pháp tra cứu ảnh theo đồ thị được giới thiệu ở đây không dựa

Trang 24

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

trên các đặc điểm ở mức thấp (trừ giai đoạn khởi tạo) mà dựa vào những sự liên kết

có tính trực giác giữa các ảnh được thiết lập bởi người sử dụng bằng cách phản hồi thích hợp

Mục tiêu của phương pháp này là xây dựng một sơ đồ để tích luỹ thông tin

do những tương tác với người sử dụng theo cách đơn giản hơn phản hồi thích hợp

và sử dụng những thông tin này để việc tra cứu ảnh cho những kết quả có ý nghĩa trực giác hơn [8]

1.2 Bài toán tra cứu địa danh du lịch

1.2.1 Địa danh du lịch

Địa danh du lịch là những khu di tích lịch sử văn hóa tâm linh, viện bảo tàng, những danh lam thắng cảnh các bãi biển hay các khu nghỉ dưỡng …

1.2.2 Đặc trưng của địa danh du lịch và ảnh địa danh du lịch

Mỗi một đia danh du lịch đều có những nét đặc trưng nên ta có thể chia các địa danh đó theo các đặc điểm chung của từng loại địa danh du lịch như

- Địa danh về lịch sư như: Viện bảo tàng quân sư, bảo tàng dân tộc, và các khu di tích lịch sử văn hóa

- Địa danh về tâm linh như : Chùa Bái Đính, Chùa Hương, Đền Hùng

- Các Địa danh nghi dưỡng như : các bãi biển, các khu du lịch sinh thái

1.2.3 Ứng dụng của kỹ thuật tra cứu ảnh vào bài toán tra cứu địa danh du lịch

Ảnh địa danh du lịch là kiểu đối tượng có tính chất hình học và màu sắc đặc trưng, thường là ảnh của những địa danh, những khu vui chơi, những di tich lịch sư văn hóa

Tuy nhiên các ảnh địa danh thì không có quy luật mà chỉ là hệ thống các ảnh, các ký hiệu với ý nghĩa qui ước kèm theo Việc ghi nhớ hình dạng và ý nghĩa của tất

cả các loại ảnh địa danh du lịch đối với chúng ta sẽ là một khó khăn lớn, do đó chúng ta thường hay có nhu cầu tra cứu tìm hiểu trực quan

Với số lượng ảnh lớn như vậy, đồng thời có nhiều ảnh có hình thức và màu sắc tương tự nhau, để biết và nhớ hết từng loại ảnh địa danh du lịch là

Trang 25

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

không hề đơn giản

Để giải quyết vấn đề này chúng ta có thể sử dụng phương pháp đơn giản hơn

là tìm cách so sánh ảnh mẫu địa danh du lịch cần xác định với ảnh các địa danh du lịch đã được lưu trữ để tìm ra những địa danh du lich "giống" với địa danh du lịch cần xác định nhất

Chức năng chính cơ bản của ứng dụng là tra cứu thông tin trực quan Từ một ảnh có sẵn ứng dụng sẽ tìm các hình ảnh tương tự trong cơ sở dữ liệu và mục đích

là tìm ra ảnh đích hoặc các thông tin liên quan đến ảnh cần truy vấn

Yêu cầu chính với bài toán này là phải tìm kiếm chính xác, kết quả trả về trong thời gian nhanh nhất có thể chấp nhận được và hoạt động trên một cơ sở dữ liệu ảnh lớn

Trang 26

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Chương 2:

MỘT SỐ KỸ THUẬT TRA CỨU ĐỊA DANH DU LỊCH QUA ẢNH

2.1 Kỹ thuật tra cứu ảnh theo nội dung

Tra cứu ảnh theo nội dung (Content Based Images Retrieval CBIR) hay truy vấn theo nội dung ảnh (Query Based Image Content QBIC) là một ứng dụng của thị giác máy tính đối với bài toán tìm kiếm ảnh [30][35] “Dựa vào nội dung ảnh (Content- Based) ” nghĩa là việc tìm kiếm sẽ phân tích nội dung thực sự của các bức ảnh Nội dung ảnh ở đây được thể hiện bằng màu sắc, hình dạng, kết cấu (texture), các đặc trưng cục bộ (local features), … hay bất cứ thông tin nào có từ chính nội dung ảnh Cụm từ CBIR được T.Kato đưa ra vào năm 1992 trong quá trình thu thập ảnh một cách tự động từ cơ sở dữ liệu dựa trên biểu diễn màu sắc và hình dạng của ảnh Tee Cheng Siew đã giới thiệu một số đặc trưng nội dung ảnh[23]:

Đặc trưng màu sắc: Màu sắc là một đặc trưng nổi bật và được sử dụng phổ biến nhất trong tìm kiếm ảnh theo nội dung Mỗi một điểm ảnh (thông tin màu sắc) có thể được biểu diễn như một điểm trong không gian màu sắc ba chiều Các không gian màu sắc thường dùng là: RGB, Munsell, CIE, HSV Tìm kiếm ảnh theo màu sắc tiến hành tính toán biểu đồ màu cho mỗi ảnh để xác định tỉ trọng các điểm ảnh của ảnh mà chứa các giá trị đặc biệt (màu sắc) Các nghiên cứu gần đây đang cố gắng phân vùng ảnh theo các màu sắc khác nhau và tìm mỗi quan hệ giữa các vùng này

Đặc trưng kết cấu: Trích xuất nội dung ảnh theo kết cấu nhằm tìm ra mô hình trực quan của ảnh và cách thức chúng được xác định trong không gian Kết cấu được biểu diễn bởi các texel mà sau đó được đặt vào một số các tập phụ thuộc vào

số kết cấu được phát hiện trong ảnh Các tập này không chỉ xác định các kết cấu mà còn chỉ rõ vị trí các kết cấu trong ảnh Việc xác định các kết cấu đặc biệt trong ảnh đạt được chủ yếu bằng cách mô hình các kết cấu như những biến thể cấp độ xám 2

Trang 27

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

chiều Ví dụ về một số loại kết cấu[41]

Hình 2.1 Ví dụ về một số lọai kết cấu

Đặc trưng hình dạng: Hình dạng của một ảnh hay một vùng là một đặc trưng quan trong trong việc xác định và phân biệt ảnh trong nhận dạng mẫu Mục tiêu chính của biểu diễn hình dạng trong nhận dạng mẫu là đo thuộc tính hình học của một đối tượng được dùng trong phân lớp, so sánh và nhận dạng đối tượng

Trong một hệ thống tra cứu ảnh theo nội dung điển hình (hình vẽ 2.1) các nội dung trực quan của ảnh được trích chọn và mô tả bằng những véc tơ đặc trưng nhiều chiều Tập hợp các vec tơ đặc trưng của các ảnh trong một cơ sở dữ liệu ảnh tạo thành cơ sở dữ liệu đặc trưng Quá trình tra cứu ảnh được tiến hành như sau: người

sử dụng cung cấp cho hệ thống tra cứu một ảnh mẫu cụ thể hoặc hình vẽ phác thảo của đối tượng ảnh cần tìm Sau đó hệ thống sẽ chuyển những mẫu này thành các véc

tơ đặc trưng và tính toán sự giống nhau (hay độ tương tự) giữa véc tơ đặc trưng của ảnh mẫu và véc tơ đặc trưng của các ảnh trong cơ sở dữ liệu Sau cùng việc tra cứu được tiến hành với sự trợ giúp của các sơ đồ đánh chỉ số Sử dụng sơ đồ đánh chỉ số

Trang 28

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

là cách hiệu quả để tìm kiếm trong các cơ sở dữ liệu ảnh

Hình 2.2 Mô hình hệ thống Tra cứu ảnh theo nội dung

Trong mô hình này, người sử dụng sẽ tạo truy vấn bằng cách chọn một ảnh mẫu trong một cơ sở dữ liệu ảnh cho trước hoặc phác thảo một hình vẽ mô tả đối tượng ảnh cần tìm bằng cách sử dụng một giao diện đồ hoạ của hệ thống

Ảnh mẫu đó được đưa qua khối mô tả nội dung trực quan, trong đó người ta

sử dụng một phương pháp mô tả nội dung trực quan nào đó để trích chọn một đặc điểm nội dung trực quan để xây dựng thành một véc tơ đặc trưng

Véc tơ đặc trưng của ảnh mẫu sẽ được so sánh với véc tơ đặc trưng tương ứng của các ảnh trong cơ sở dữ liệu ảnh Kết quả của phép so sánh là một chỉ số đánh giá độ tương tự giữa ảnh mẫu và ảnh lấy ra để so sánh

Dựa vào chỉ số độ tương tự tính toán được ở trên, hệ thống sẽ sắp xếp các ảnh tìm được trong cơ sở dữ liệu ảnh theo một sơ đồ đánh chỉ số nào đó Danh sách các ảnh tìm được (đã được sắp xếp) được đưa ra đầu ra của hệ thống

2.2 Kỹ thuật tra cứu ảnh dựa vào màu sắc

Tạo truy vấn

Mô tả Nội dung Trực quan

Các Vector Đặc trưng

Cơ sở Dữ

liệu ảnh

Mô tả Nội dung Trực quan

Cơ sở Dữ liệu Đặc trưng

Đánh giá độ tương tự

Tra cứu và Đánh chỉ số Kết quả tra cứu

Phản hồi thích hợp

Người

sử

dụng

Đầu ra

Trang 29

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Trên thực tế thì màu sắc được sử dụng nhiều nhất để mô tả nội dung trực quan của ảnh Lý do là vì màu sắc của ảnh có tác động lớn đến nhận thức của con người về nội dung của ảnh hơn là các đặc điểm khác như hình dạng của các đối tượng ảnh, kết cấu của ảnh hay sự phân bố không gian của các đối tượng ảnh

Màu sắc được biểu diễn thông qua một véc tơ 3 chiều sẽ có khả năng biểu diễn tốt hơn so với việc chỉ sử dụng giá trị độ xám của ảnh (1 chiều) Trước khi xem xét kỹ hơn về các phương pháp mô tả nội dung màu sắc, chúng ta cùng tìm hiểu sơ lược về các không gian màu

2.2.1 Không gian màu

Mỗi điểm ảnh trên một bức ảnh có thể được biểu diễn bằng một điểm trong một không gian màu 3 chiều Những không gian màu được sử dụng nhiều nhất trong các hệ thống tra cứu ảnh là RGB, CIE L*a*b, CIE L*u*v, HSV và không gian màu đối lập

Người ta cũng chưa chỉ ra được rằng không gian màu nào được sử dụng tốt hơn cho việc tra cứu ảnh Tuy nhiên tính chất quan trọng nhất để một không gian màu phù hợp để sử dụng trong một hệ thống tra cứu ảnh là tính đồng nhất Một không gian màu được gọi là có tính đồng nhất nếu các cặp 2 màu tương tự nhau trong không gian màu thì cũng được con người cảm nhận như nhau Nói một cách khác, khoảng cách đo được giữa hai màu bất kỳ phải có liên quan trực tiếp với độ tương tự sinh học giữa hai màu đó

RGB là không gian màu được sử dụng phổ biến nhất để hiển thị ảnh Không gian RGB bao gồm 3 thành phần màu là Đỏ (Red), Xanh lá cây (Green) và Xanh lam (Blue) Các thành phần này gọi là màu cộng bởi vì các màu sắc trong không gian RGB đều có thể thu được bằng cách cộng 3 thành phần màu này lại với nhau

Ngược lại, CMY là không gian màu thường sử dụng trong in ấn Ba thành phần màu của không gian CMY là màu xanh lơ (Cyan), hồng sẫm (Magenta) và vàng (Yellow) Ba thành phần này gọi là các thành phần màu trừ vì mỗi màu trong không gian CMY được sinh ra bởi sự hấp thụ các thành phần màu đó

Cả RGB và CMY đều phụ thuộc thiết bị và không có tính đồng nhất

Trang 30

Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/

Các không gian màu CIE L*a*b và CIE L*u*v là các không gian màu không phụ thuộc thiết bị và có thể coi là đồng nhất Bao gồm các thành phần độ sáng (L)

và hai thành phần độ kết tủa màu (sắc độ màu) là a và b hoặc u và v CIE L*a*b được thiết kế để làm việc với việc trộn các thành phần màu trừ còn CIE L*u*v được thiết kế để làm việc với việc trộn các thành phần màu cộng

Các không gian màu RGB và CIE có thể chuyển đổi với nhau, tức là chúng

ta có thể sử dụng các công thức để chuyển đổi một giá trị màu từ không gian màu này sang không gian màu khác

Không gian màu HSV được sử dụng rộng rãi trong đồ hoạ máy tính và được coi là một phương pháp biểu diễn màu sắc trực quan hơn Ba thành phần màu là sắc màu (hue), độ bão hoà màu (s) và giá trị độ sáng (v) Thành phần sắc màu không thay đổi khi ta thay đổi độ chiếu sáng hay góc quan sát vì vậy thích hợp để sử dụng trong việc nhận dạng đối tượng ảnh Cũng có thể dễ dàng chuyển đổi các giá trị từ không gian HSV sang RGB và ngược lại

Không gian màu đối lập sử dụng các trục màu ngược (R-G, 2B-R-G, R+G+B), cách biểu diễn này có ưu điểm là tách được thông tin về độ sáng ra một trục riêng biệt (trục thứ ba) Bằng cách này, hai thành phần kết tủa màu sẽ không bị thay đổi khi thay đổi độ chiếu sáng

Các phần tiếp theo sẽ giới thiệu một số phương pháp mô tả nội dung màu sắc của ảnh: các moment màu, histogram màu, véc tơ gắn kết màu và biểu đồ tương quan màu

2.2.2 Các moment màu

Các moment màu đã được sử dụng rất thành công trong nhiều hệ thống tra cứu ảnh đặc biệt là khi ảnh chỉ chứa một đối tượng ảnh Các thành phần moment bậc nhất (trung vị), bậc hai (phương sai) và bậc ba (độ lệch) đã được chứng minh là

có thể được sử dụng rất hiệu quả để biểu diễn sự phân bố màu sắc của ảnh

Công thức toán học để biểu diễn 3 moment này như sau:

Ngày đăng: 24/03/2021, 19:01

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w