CSDL ảnh …: General database– Nội dung đa dạng, không đồng nhất – Biểu diễn dựa trên các đặc trưng chung shape, color, texture,..– Vùng ứng dụng rộng... Kiểu truy vấn: dựa trên nội dung–
Trang 2Nội dung
– Đặc trưng toàn cục: Shape – texture - color– Đặc trưng cục bộ:
Phân đoạn (segmentation)
Key points (characters points)
Trang 5Ảnh và lưu trữ
Về mặt toán học:
Đối với người dùng:
– Ảnh chứa các thông tin về ngữ nghĩa
Trang 6Phân loại ảnh
Ảnh tự nhiên : ảnh thu nhận từ các thiết bị
– camera, microscope, tomography, infrared, satellite, …
Ảnh nhân tạo : tạo ra từ các phần mềm chuyên biệt
– Đồ họa máy tính (computer graphics), thực tại ảo (virtual
reality)
Trang 7Ảnh mức xám
I(x,y) [0 255]
Ảnh nhị phân I(x,y) {0 , 1}
Ảnh màu
IR(x,y) IG(x,y) IB(x,y)
Phân loại ảnh
Trang 8Ảnh màu trong hệ tọa độ RGB
Bên cạnh hệ tọa độ màu RGB ta còn có các hệ tọa độ màu
Trang 9Cơ sở dữ liệu ảnh
– CSDL chung (General database) : Photo collection, Internet
– CSDL hẹp/cụ thể (Specific database): face database, medicaldatabase
Trang 10CSDL ảnh (…): General database
– Nội dung đa dạng, không đồng nhất
– Biểu diễn dựa trên các đặc trưng chung (shape, color, texture, )– Vùng ứng dụng rộng
Trang 11CSDL ảnh (…): Specific database
– Thường dành cho các ứng dụng đặt biệt (ảnh sinh trắc học bimometry, ảnh y học – medical images)
(-– Đặc trưng được trích chọn tùy thuộc vào mỗi lĩnh vực ứngdụng
Trang 12Tìm kiếm ảnh
Where ?
Trang 13Kiểu truy vấn: từ khóa
Trang 14Kiểu truy vấn: từ khóa
– Từ khóa được lấy từ:
Văn bản xung quanh ảnh (Google Image, Google Video)
Đánh dấu thủ công giá thành cao
– Nhập nhằng: chọn từ khóa thế nào ?
Tính chủ quan của người đánh dấu keyword-image
Phụ thuộc ngôn ngữ
Trang 15Kiểu truy vấn: dựa trên nội dung
Trang 16Kiểu truy vấn: dựa trên nội dung
Trang 17Kiểu truy vấn: dựa trên nội dung
– Truy vấn chứa hình ảnh
– Mục đích tìm kiếm : «tương tự »: đối sánh không chính xác
Trích chọn tự động các đặc trưng và tìm kiếm dựa trên độ tương tự giữa các đặc trưng
Lĩnh vực nghiên cứu đang được quan tâm
Truy vấn:
Trang 18Kiểu truy vấn: dựa trên nội dung
– Nội dung đa dạng
– Khối lượng dữ liệu cần xử lý lớn và thường trùng lặp:
Numeric gap
– Vấn đề về ngữ nghĩa: Semantic gap
VD: làm thế nào để biết 1 người đang vui /buồn
Trang 19CBIR
Trang 20CBIR – các bước chính
chương 3)
Trang 21Trích chọn đặc trưng
Trang 22Biểu diễn ảnh – trích chọn đặc trưng
– Màu sắc, hình dáng, kết cấu, …
Phân vùng
Key points (characters points)
Nhận dạng vân tay: minuties (các điểm đầu, điểm rẽ nhánh)
Trang 23Đặc trưng toàn cục
Trang 24Đặc trưng màu sắc
– Thể hiện sự phân bố màu sắc trên ảnh
Trang 25Đặc trưng màu sắc
– thường sử dụng k/c L1 hoặc L2 (euclide):
– Giao giữa 2 histogram
) ,
min(
G) (H,
Trang 26Ưu điểm của phân bố màu
biến đổi hình học:
– Phép quay
– Phép tịnh tiến
– zoom
Trang 27Vấn đề gặp phải với phân bố màu
– Không tính đến sự gần giống giữa
các màu trong các màu (bin) gần
nhau
– Việc phân bố trong không gian các
màu điểm ảnh: 2 ảnh khác nhau,
histogram có thể giống nhau
Trang 28Vấn đề gặp phải với phân bố màu
– Ảnh hưởng của nền: d(I1,I2) ? d(I1, I3)
I1
I2
I3
Trang 29Đặc trưng kết cấu
– Khó mô tả và biểu diễn
– Tập các primitive (mẫu) được sắp sếp theo quy tắc sắp chỗ
nào đó
– Primitive: tập 1 hoặc nhiều điểm liên thông với nhau có độxám (màu sắc) gần giống nhau
Trang 30Đặc trưng kết cấu (…)
Trang 31Đặc trưng kết cấu (…)
Trang 32Đặc trưng kết cấu (…)
– Phân tích thống kê
Tham số tính từ biểu đồ phân bố màu (histogram)
Phân tích ma trận đồng xuất hiện (Co-occurrence matric)
– Phân tích trên miền tần số
Biến đổi Fourrier
Trang 33Đặc trưng kết cấu(…)
Ma trận đồng xuất hiện :
}) )
, ( 2
, 1 ({
}) )
, ( ,
) ( , )
( ,
({
) , (
2 1 ,
2 1 ,
2 2
1 1
2 1 ,
true p
p N
p p card
true p
p N
c p
I c p
I p p
card c
c CM
d
d j
p
Trang 34)) ,
( log(
) , ( i j CM i j
Trang 35Đặc trưng hình dạng
Chuỗi mã hóa, sấp xỉ đa giác, B-splines, …
Chu vi, tỷ số nén, độ lệch tâm, …
Bao lồi, trục trung vị, …
Diện tích, moments hình học (invariant moments),
Trang 36Ví dụ: chuỗi mã hóa Freeman
Trang 37Câu 2: Tính ma trận đồng xuất hiện d=1, ß=90
Bài tập – Đặc trưng toàn cục
Câu 1: Tính khoảng cách giữa hai ảnh sau dựa trên phân
bố màu (histogram)
Trang 38Đặc trưng cục bộ
Tìm các vùng/ các đối tượng tương tự
Truy vấn bộ phận (partial query)
Tìm những bức ảnh có chưa bông hoa hướng dương
Trang 39Phân vùng ảnh
Trích chọn các điểm đặc trưng
Chia tự động
theo kế hoạch
định sẵn
Định nghĩa các vùng thế nào ?
Trang 40Biểu diễn ảnh – phân đoạn ảnh
Trang 42Phân đoạn ảnh
– Sự không liên tục: các biên (edge, contour)
Sự thay đổi về giá trị ở biên giữa các vùng– Sự đồng nhất: tương ứng cho các vùng
Cùng màu sắc, kết cấu,…
Trang 43Phân đoạn ảnh – cách tiếp cận
Trang 44Phân đoạn bằng ngưỡng
phân đoạn các đối tượng trong ảnh
Ý tưởng chính:
– IF value(pixel) >= threshold THEN value(pixel) = 1
– IF value(pixel) < threshold THEN value(pixel) = 0
Ảnh nhị phân
Trang 45Phân vùng bằng ngưỡng (…)
– Toàn cục: một ngưỡng cho toàn bộ ảnh
– Cục bộ: một ngưỡng cho 1 vùng của ảnh
– Thích nghi: ngưỡng được lựa chọn phù hợp với từng ảnhhoặc từng vùng của ảnh
Lựa chọn ngưỡng thế nào ??
Trang 46Ngưỡng dựa trên phân bố
1 if f(x,y) T ( , )
Trang 47Ngưỡng dựa trên phân bố (…)
Đơn giản, nhanh
Nhược:
– Cần biết trước số lớp
– Không có ràng buộc về không gian
Xác định giá trị ngưỡng ?
– Bằng thử nghiệm, TB mức xám, TB max & min
– Giá trị cho phép cân bằng giữa các vùng của phân bố
Tự động: T sao cho lỗi là nhỏ nhất
T
E 1 E
2 Class 1
Class 2
Trang 48Vấn đề với ngưỡng toàn cục
Trang 49Vấn đề với ngưỡng toàn cục ( )
Trang 50Ví dụ với ngưỡng cục bộ
Trang 51Ví dụ với ngưỡng cục bộ
Trang 54Giải thuật K-means
– Các điểm được phân vào K nhóm (clusters)
– Tâm của nhóm: giá trị trung bình của tất cả các phần tử trongnhóm
Số lớp (K) biết trước và cố định
trong không gian
Trang 55Giải thuật K-means (…)
Trang 56Giải thuật K-means (…)
Trang 57Giải thuật K-means (…)
Trang 58Phân đoạn dựa trên điểm ảnh
Các vùng thu được có thể không liên thông
Xử lý: Xóa bỏ các điểm ảnh rời rạc
Trang 59Phân đoạn dựa trên vùng
Trang 60Split-and-Merge (Chia và hợp)
– Chia đệ quy các vùng không đồng nhất
theo một tiêu chuẩn nào đó (phương sai,
max,min) thành các vùng nhỏ hơn
– Chia một vùng thành 4 vùng con
– Tính chất của vùng con được tính toán
Trang 61– 4 phần này sẽ trở thành nút con của F
Trang 63Split-and-Merge (…): Hợp
Cây tứ phân
Nối các vùng lân cận đồng nhất
Trang 64Region growing (Phát triển vùng)
– Giải thuật bắt đầu với 1 điểm ảnh và lựa chọn các điểm ảnh
lân cận để gộp lại theo tiêu chuẩn nào đó: phương sai nhỏ, – Điểm ảnh khởi tạo được gọi là hạt giống/nhân
– Vùng sẽ được phát triển từ hạt giống
– Các hiểu biết về ảnh cần phân đoạn được sử dụng để lựa
Trang 65Region growing (…)
– Tự động
– Thủ công
Trang 66Phát triển vùng với nhiều hạt giống
Trang 67Lưu ý: Tham số
– Không có tham số chung, phải lựa chọn tùy vào ứng dụng
Giá trị cố định (hằng số)
Giá trị tương đối (%, trung bình, …)
Giá trị được tính toán bằng thuật toán
Trang 68Lưu ý: …
Không có thuật toán tối ưu cho bài toán phân đoạn
Không có thuật toán chung cho tất cả các bài toán tùy thuộc ứng dụng
hiệu quả
các phần ta muốn nhìn thấy trong ảnh
Trang 69Phân đoạn: hạn chế
cả các đối tượng
Trang 70 1 vùng có thể không chứa 1đối tượng
Phân đoạn: hạn chế
Trang 71Ví dụ
Trang 72 Dựa trên nghiên cứu về cách quan sát của con người
Thông tin ngữ cảnh xung quanh : quan trọng
Cách tiếp cận Gestalt
Trang 73 Một số tiêu chuẩn nhóm:
Proximity : các đối tượng gần nhau
Similarity : các đối tượng giống nhau
Common faith : các đối tượng có kiểu di chuyển giống nhau
Common region : các đối tượng trong cùng 1 vùng
Parallel : các đường song song
Closing : các cung và đối tượng có hình dạng đóng
Symmetry : các cung và đối tượng đối xứng
Cách tiếp cận Gestalt (…)
Trang 74 Trích chọn các điểm đặc trưng
– Ảnh mức xám : Moravec (1977), Harris et Stephens (1988),
Harris (1996), Susan (Smith et Brady, 1997), SIFT (1999), …– Ảnh màu: Kitchen et Rosenfeld color (1998), Harris color(1998)
đặc trưng
– SIFT(1999), SURF, GLOH, …
Trang 75Đặc trưng cục bộ: các điểm đặc trưng (…)
Trang 76SIFT Keypoint Detector
Trang 77Keypoint Descriptor
– các biển đổi hình học: quay, tịnh tiến, zoom,
– sự thay đổi hướng camera
– sự thay đổi độ sáng
Trang 78SIFT Keypoint Descriptor
Trang 79Ví dụ truy vấn bộ phận
Trang 80Đối sánh
Trang 81Đối sánh
– So sánh dựa trên độ tương tự giữa 2 vectors đặc trưng
– Khoảng cách có thể là: L1, L2, cosine, Mahalanobis, …
) ,
( )
, ( I1 I2 d v1 v2
d
Trang 82Đối sánh (…) : đặc trưng cục bộ
trưng
– So sánh kết hợp (IRM (Intergrated Regions Matching), EMD
(Earth Mover’s Distance), chiến lược bỏ phiếu…) dựa trên
khoảng cách từng cặp vector tương ứng với các vùng/cácđiểm trên 2 ảnh
– Ảnh sử dụng « khái niệm » sử dụng độ đo tương tự giữacác « khái niệm »
Trang 83Đối sánh (…): khoảng cách IRM
Trang 84Đối sánh (…): khoảng cách IRM
Ảnh I1: biểu diễn bởi tập các vùng R1 = {r1, r2, …, rm}
Ảnh I2: biểu diễn bởi tập các vùng R2 = {r’1, r’2, …, r’n}
– ri, r’j: đặc trưng của các vùng i, j tương ứng
– si,j: ý nghĩa của ghép cặp ri và r’j
– Tầm quan trọng của vùng i trong ảnh I1:
) ' , ( )
, (
) ,
(
,
, 2
1 2
j i
j i IRM I I d R R s d r r
d
i j
i p
s
Trang 85Đối sánh (…): khoảng cách EMD
EMD: Earth Mover’s Distance
EMD đánh giá chí phí tối thiểu cần thiết để dịch chuyển một phân bố này sang 1 phân bố khác
Trang 86Đối sánh (…): khoảng cách EMD
Trang 87Đối sánh (…): khoảng cách EMD
Tính EMD bài toán vận chuyển/ lập lịch
f I
j ij
ij
w f
w f
f
Trang 88Bỏ phiếu
Trang 89Đối sánh 2 điểm đặc trưng
Sự tương tự giữa các vector đặc trưng giữa 2 điểm
Thường có tính đến các ràng buộc về không gian với các điểm trong lân cận của nó để tăng hiệu quả truy vấn
Trang 90Truy vấn với ràng buộc không gian
I: đối tượng O1, O2
Truy vấn với ràng buộc thời gian:
– O1 ở phía trên/ bên trái / phía đông bắc/ … của O2 ?
Trang 91Ràng buộc không gian: 1-D
Trang 92Ràng buộc không gian: 2-D
Có thể thực hiện dựa trên phép chiếu lên x, y
Sử dụng tổ hợp các phép toán quan hệ trên không gian 1D
VD:
Trang 93CBIR