1. Trang chủ
  2. » Công Nghệ Thông Tin

slike bài giảng cơ sở dữ liệu đa phương tiện - nguyễn thị oanh chương 4a tìm kiếm dl đptp2 dữ liệu ảnh

94 375 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 94
Dung lượng 3,31 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

CSDL ảnh …: General database– Nội dung đa dạng, không đồng nhất – Biểu diễn dựa trên các đặc trưng chung shape, color, texture,..– Vùng ứng dụng rộng... Kiểu truy vấn: dựa trên nội dung–

Trang 2

Nội dung

– Đặc trưng toàn cục: Shape – texture - color– Đặc trưng cục bộ:

 Phân đoạn (segmentation)

 Key points (characters points)

Trang 5

Ảnh và lưu trữ

 Về mặt toán học:

 Đối với người dùng:

– Ảnh chứa các thông tin về ngữ nghĩa

Trang 6

Phân loại ảnh

 Ảnh tự nhiên : ảnh thu nhận từ các thiết bị

– camera, microscope, tomography, infrared, satellite, …

 Ảnh nhân tạo : tạo ra từ các phần mềm chuyên biệt

Đồ họa máy tính (computer graphics), thực tại ảo (virtual

reality)

Trang 7

Ảnh mức xám

I(x,y)  [0 255]

Ảnh nhị phân I(x,y)  {0 , 1}

Ảnh màu

IR(x,y) IG(x,y) IB(x,y)

Phân loại ảnh

Trang 8

Ảnh màu trong hệ tọa độ RGB

Bên cạnh hệ tọa độ màu RGB ta còn có các hệ tọa độ màu

Trang 9

Cơ sở dữ liệu ảnh

– CSDL chung (General database) : Photo collection, Internet

– CSDL hẹp/cụ thể (Specific database): face database, medicaldatabase

Trang 10

CSDL ảnh (…): General database

– Nội dung đa dạng, không đồng nhất

– Biểu diễn dựa trên các đặc trưng chung (shape, color, texture, )– Vùng ứng dụng rộng

Trang 11

CSDL ảnh (…): Specific database

– Thường dành cho các ứng dụng đặt biệt (ảnh sinh trắc học bimometry, ảnh y học – medical images)

(-– Đặc trưng được trích chọn tùy thuộc vào mỗi lĩnh vực ứngdụng

Trang 12

Tìm kiếm ảnh

Where ?

Trang 13

Kiểu truy vấn: từ khóa

Trang 14

Kiểu truy vấn: từ khóa

– Từ khóa được lấy từ:

 Văn bản xung quanh ảnh (Google Image, Google Video)

 Đánh dấu thủ công  giá thành cao

– Nhập nhằng: chọn từ khóa thế nào ?

 Tính chủ quan của người đánh dấu keyword-image

 Phụ thuộc ngôn ngữ

Trang 15

Kiểu truy vấn: dựa trên nội dung

Trang 16

Kiểu truy vấn: dựa trên nội dung

Trang 17

Kiểu truy vấn: dựa trên nội dung

– Truy vấn chứa hình ảnh

– Mục đích tìm kiếm : «tương tự »: đối sánh không chính xác

 Trích chọn tự động các đặc trưng và tìm kiếm dựa trên độ tương tự giữa các đặc trưng

 Lĩnh vực nghiên cứu đang được quan tâm

 Truy vấn:

Trang 18

Kiểu truy vấn: dựa trên nội dung

Nội dung đa dạng

Khối lượng dữ liệu cần xử lý lớn và thường trùng lặp:

Numeric gap

– Vấn đề về ngữ nghĩa: Semantic gap

 VD: làm thế nào để biết 1 người đang vui /buồn

Trang 19

CBIR

Trang 20

CBIR – các bước chính

chương 3)

Trang 21

Trích chọn đặc trưng

Trang 22

Biểu diễn ảnh – trích chọn đặc trưng

– Màu sắc, hình dáng, kết cấu, …

 Phân vùng

 Key points (characters points)

 Nhận dạng vân tay: minuties (các điểm đầu, điểm rẽ nhánh)

Trang 23

Đặc trưng toàn cục

Trang 24

Đặc trưng màu sắc

– Thể hiện sự phân bố màu sắc trên ảnh

Trang 25

Đặc trưng màu sắc

– thường sử dụng k/c L1 hoặc L2 (euclide):

– Giao giữa 2 histogram

) ,

min(

G) (H,

Trang 26

Ưu điểm của phân bố màu

biến đổi hình học:

– Phép quay

– Phép tịnh tiến

– zoom

Trang 27

Vấn đề gặp phải với phân bố màu

– Không tính đến sự gần giống giữa

các màu trong các màu (bin) gần

nhau

– Việc phân bố trong không gian các

màu điểm ảnh: 2 ảnh khác nhau,

histogram có thể giống nhau

Trang 28

Vấn đề gặp phải với phân bố màu

– Ảnh hưởng của nền: d(I1,I2) ? d(I1, I3)

I1

I2

I3

Trang 29

Đặc trưng kết cấu

– Khó mô tả và biểu diễn

Tập các primitive (mẫu) được sắp sếp theo quy tắc sắp chỗ

nào đó

Primitive: tập 1 hoặc nhiều điểm liên thông với nhau có độxám (màu sắc) gần giống nhau

Trang 30

Đặc trưng kết cấu (…)

Trang 31

Đặc trưng kết cấu (…)

Trang 32

Đặc trưng kết cấu (…)

Phân tích thống kê

 Tham số tính từ biểu đồ phân bố màu (histogram)

 Phân tích ma trận đồng xuất hiện (Co-occurrence matric)

Phân tích trên miền tần số

 Biến đổi Fourrier

Trang 33

Đặc trưng kết cấu(…)

 Ma trận đồng xuất hiện :

}) )

, ( 2

, 1 ({

}) )

, ( ,

) ( , )

( ,

({

) , (

2 1 ,

2 1 ,

2 2

1 1

2 1 ,

true p

p N

p p card

true p

p N

c p

I c p

I p p

card c

c CM

d

d j

p

Trang 34

)) ,

( log(

) , ( i j CM i j

Trang 35

Đặc trưng hình dạng

 Chuỗi mã hóa, sấp xỉ đa giác, B-splines, …

 Chu vi, tỷ số nén, độ lệch tâm, …

 Bao lồi, trục trung vị, …

 Diện tích, moments hình học (invariant moments),

Trang 36

Ví dụ: chuỗi mã hóa Freeman

Trang 37

Câu 2: Tính ma trận đồng xuất hiện d=1, ß=90

Bài tập – Đặc trưng toàn cục

Câu 1: Tính khoảng cách giữa hai ảnh sau dựa trên phân

bố màu (histogram)

Trang 38

Đặc trưng cục bộ

 Tìm các vùng/ các đối tượng tương tự

 Truy vấn bộ phận (partial query)

Tìm những bức ảnh có chưa bông hoa hướng dương

Trang 39

Phân vùng ảnh

Trích chọn các điểm đặc trưng

Chia tự động

theo kế hoạch

định sẵn

Định nghĩa các vùng thế nào ?

Trang 40

Biểu diễn ảnh – phân đoạn ảnh

Trang 42

Phân đoạn ảnh

– Sự không liên tục: các biên (edge, contour)

 Sự thay đổi về giá trị ở biên giữa các vùng– Sự đồng nhất: tương ứng cho các vùng

 Cùng màu sắc, kết cấu,…

Trang 43

Phân đoạn ảnh – cách tiếp cận

Trang 44

Phân đoạn bằng ngưỡng

phân đoạn các đối tượng trong ảnh

Ý tưởng chính:

IF value(pixel) >= threshold THEN value(pixel) = 1

IF value(pixel) < threshold THEN value(pixel) = 0

Ảnh nhị phân

Trang 45

Phân vùng bằng ngưỡng (…)

– Toàn cục: một ngưỡng cho toàn bộ ảnh

– Cục bộ: một ngưỡng cho 1 vùng của ảnh

– Thích nghi: ngưỡng được lựa chọn phù hợp với từng ảnhhoặc từng vùng của ảnh

 Lựa chọn ngưỡng thế nào ??

Trang 46

Ngưỡng dựa trên phân bố

1 if f(x,y) T ( , )

Trang 47

Ngưỡng dựa trên phân bố (…)

 Đơn giản, nhanh

 Nhược:

– Cần biết trước số lớp

– Không có ràng buộc về không gian

 Xác định giá trị ngưỡng ?

– Bằng thử nghiệm, TB mức xám, TB max & min

– Giá trị cho phép cân bằng giữa các vùng của phân bố

 Tự động: T sao cho lỗi là nhỏ nhất

T

E 1 E

2 Class 1

Class 2

Trang 48

Vấn đề với ngưỡng toàn cục

Trang 49

Vấn đề với ngưỡng toàn cục ( )

Trang 50

Ví dụ với ngưỡng cục bộ

Trang 51

Ví dụ với ngưỡng cục bộ

Trang 54

Giải thuật K-means

– Các điểm được phân vào K nhóm (clusters)

– Tâm của nhóm: giá trị trung bình của tất cả các phần tử trongnhóm

 Số lớp (K) biết trước và cố định

trong không gian

Trang 55

Giải thuật K-means (…)

Trang 56

Giải thuật K-means (…)

Trang 57

Giải thuật K-means (…)

Trang 58

Phân đoạn dựa trên điểm ảnh

Các vùng thu được có thể không liên thông

Xử lý: Xóa bỏ các điểm ảnh rời rạc

Trang 59

Phân đoạn dựa trên vùng

Trang 60

Split-and-Merge (Chia và hợp)

– Chia đệ quy các vùng không đồng nhất

theo một tiêu chuẩn nào đó (phương sai,

max,min) thành các vùng nhỏ hơn

– Chia một vùng thành 4 vùng con

– Tính chất của vùng con được tính toán

Trang 61

– 4 phần này sẽ trở thành nút con của F

Trang 63

Split-and-Merge (…): Hợp

Cây tứ phân

Nối các vùng lân cận đồng nhất

Trang 64

Region growing (Phát triển vùng)

Giải thuật bắt đầu với 1 điểm ảnh và lựa chọn các điểm ảnh

lân cận để gộp lại theo tiêu chuẩn nào đó: phương sai nhỏ, – Điểm ảnh khởi tạo được gọi là hạt giống/nhân

– Vùng sẽ được phát triển từ hạt giống

Các hiểu biết về ảnh cần phân đoạn được sử dụng để lựa

Trang 65

Region growing (…)

– Tự động

– Thủ công

Trang 66

Phát triển vùng với nhiều hạt giống

Trang 67

Lưu ý: Tham số

Không có tham số chung, phải lựa chọn tùy vào ứng dụng

 Giá trị cố định (hằng số)

 Giá trị tương đối (%, trung bình, …)

 Giá trị được tính toán bằng thuật toán

Trang 68

Lưu ý: …

 Không có thuật toán tối ưu cho bài toán phân đoạn

 Không có thuật toán chung cho tất cả các bài toán  tùy thuộc ứng dụng

hiệu quả

 các phần ta muốn nhìn thấy trong ảnh

Trang 69

Phân đoạn: hạn chế

cả các đối tượng

Trang 70

 1 vùng có thể không chứa 1đối tượng

Phân đoạn: hạn chế

Trang 71

Ví dụ

Trang 72

 Dựa trên nghiên cứu về cách quan sát của con người

 Thông tin ngữ cảnh xung quanh : quan trọng

Cách tiếp cận Gestalt

Trang 73

 Một số tiêu chuẩn nhóm:

 Proximity : các đối tượng gần nhau

 Similarity : các đối tượng giống nhau

 Common faith : các đối tượng có kiểu di chuyển giống nhau

 Common region : các đối tượng trong cùng 1 vùng

 Parallel : các đường song song

 Closing : các cung và đối tượng có hình dạng đóng

 Symmetry : các cung và đối tượng đối xứng

Cách tiếp cận Gestalt (…)

Trang 74

 Trích chọn các điểm đặc trưng

– Ảnh mức xám : Moravec (1977), Harris et Stephens (1988),

Harris (1996), Susan (Smith et Brady, 1997), SIFT (1999), …– Ảnh màu: Kitchen et Rosenfeld color (1998), Harris color(1998)

đặc trưng

SIFT(1999), SURF, GLOH,

Trang 75

Đặc trưng cục bộ: các điểm đặc trưng (…)

Trang 76

SIFT Keypoint Detector

Trang 77

Keypoint Descriptor

– các biển đổi hình học: quay, tịnh tiến, zoom,

– sự thay đổi hướng camera

– sự thay đổi độ sáng

Trang 78

SIFT Keypoint Descriptor

Trang 79

Ví dụ truy vấn bộ phận

Trang 80

Đối sánh

Trang 81

Đối sánh

– So sánh dựa trên độ tương tự giữa 2 vectors đặc trưng

– Khoảng cách có thể là: L1, L2, cosine, Mahalanobis, …

) ,

( )

, ( I1 I2 d v1 v2

d

Trang 82

Đối sánh (…) : đặc trưng cục bộ

trưng

– So sánh kết hợp (IRM (Intergrated Regions Matching), EMD

(Earth Mover’s Distance), chiến lược bỏ phiếu…) dựa trên

khoảng cách từng cặp vector tương ứng với các vùng/cácđiểm trên 2 ảnh

– Ảnh sử dụng « khái niệm »  sử dụng độ đo tương tự giữacác « khái niệm »

Trang 83

Đối sánh (…): khoảng cách IRM

Trang 84

Đối sánh (…): khoảng cách IRM

Ảnh I1: biểu diễn bởi tập các vùng R1 = {r1, r2, …, rm}

Ảnh I2: biểu diễn bởi tập các vùng R2 = {r’1, r’2, …, r’n}

– ri, r’j: đặc trưng của các vùng i, j tương ứng

si,j: ý nghĩa của ghép cặp ri và r’j

Tầm quan trọng của vùng i trong ảnh I1:

) ' , ( )

, (

) ,

(

,

, 2

1 2

j i

j i IRM I I d R R s d r r

d   

i j

i p

s

Trang 85

Đối sánh (…): khoảng cách EMD

 EMD: Earth Mover’s Distance

 EMD đánh giá chí phí tối thiểu cần thiết để dịch chuyển một phân bố này sang 1 phân bố khác

Trang 86

Đối sánh (…): khoảng cách EMD

Trang 87

Đối sánh (…): khoảng cách EMD

 Tính EMD  bài toán vận chuyển/ lập lịch

f I

j ij

ij

w f

w f

f

 

Trang 88

Bỏ phiếu

Trang 89

Đối sánh 2 điểm đặc trưng

 Sự tương tự giữa các vector đặc trưng giữa 2 điểm

 Thường có tính đến các ràng buộc về không gian với các điểm trong lân cận của nó để tăng hiệu quả truy vấn

Trang 90

Truy vấn với ràng buộc không gian

 I: đối tượng O1, O2

 Truy vấn với ràng buộc thời gian:

– O1 ở phía trên/ bên trái / phía đông bắc/ … của O2 ?

Trang 91

Ràng buộc không gian: 1-D

Trang 92

Ràng buộc không gian: 2-D

 Có thể thực hiện dựa trên phép chiếu lên x, y

 Sử dụng tổ hợp các phép toán quan hệ trên không gian 1D

 VD:

Trang 93

CBIR

Ngày đăng: 24/10/2014, 10:03

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w