1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn nghiên cứu phương pháp nhận dạng hình dạng luận văn thạc sĩ

75 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu phương pháp nhận dạng hình dạng
Tác giả Đinh Thị Kim Phượng
Người hướng dẫn TS. Nguyễn Kim Anh
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Xử lý thông tin và truyền thông
Thể loại Luận văn thạc sĩ
Năm xuất bản 2006
Thành phố Hà Nội
Định dạng
Số trang 75
Dung lượng 175,26 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Mặt khác các đặc trưng thị giác của ảnh rất khó mô tá bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đố là khả năng tìm kiếm ảnh

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HA NOI

LUẬN VĂN THẠC SĨ KHOA HỌC

NGHIÊN CỨU PHƯƠNG PHÁP NHẬN

DẠNG HÌNH DẠNG

NGANH: XULY THONG TIN VA TRUYEN THONG

DINH TH] KIM PHUONG

Người hướng dẫn khoa học: T.5 NGUYÊN KIM ANH

HÀ NỘI 2006

Trang 2

LOI CAM DOAN

Tôi xin cam đoan bản luận văn này là kết quả nghiên cứu của bản thân dưới

sự hướng dẫn của TS Nguyễn Kim Anh Nếu có gì sai phạm, tôi xin hoàn toàn

chịu trách nhiệm

Người làm cam đoan

Dinh Thi im Phượng

Trang 3

Chương 1:Téng quan vé tim kiếm ảnh dựa trên hình dang Error! Bookmark not

1.2.1.2, Sự hội tụ của chuỗi outer

1.2.1.3 Biến đổi Fourier

1.2.1.4 Biến đổi Fourier rời Tại

1.2.1.5 Biến đổi I'ourier hai chiều

1.2.1.6 Phạm vi của biến đổi [“ourier

1.2.2 Không gian độ chia (Seale space)

1.2.2.1 Cơ sở

1.2.2.2, Không gian độ chia Gaussian

1.2.2.3 Phạm vi của sự không tạo các đặc trưng mới

1.2.2.4 Không gian độ chia mâu thuẫn với việc đa quyết định

1.2.3.Thân luận +

1,3 Phép đo tương đương và thực hiện phép do

3.1 Phép do su giéng nhau

3.1.1 Không gian phép đo khoảng cách h Diganee Metric Spaces)

3.1.2, Khoang céch dang Minkowski

3.1.4 Thông tin tiếng kê

13.15 Đường giao biểu đổ

Trang 4

LOI NOI DAU

Ngày nay thông tin nói chưng sử dụng trong ảnh là phổ biến Rất nhiều lĩnh vực sử dụng ảnh như một công cụ để thực hiện công việc

Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn

thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng như

trạm vệ tỉnh, khó khăn trong lưu trỡ, chi phí cao cho xử lý và internet Sự đa dạng

các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số Các ứng dụng của ảnh bao gồm: giải trí số, thư viện số, gido dye va World Wide Web (www) Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc Lợi ích trước mắt của ảnh

số gồm cả mật xã hội và thương mại Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiên bạc Tuy nhiên, độ lớn của kho lưu trữ ảnh số trên

toàn thế giới có giới hạn, sự tận dụng ánh số từ CSDL hiện tại khó hơn Điều này

là vì thiếu cách đánh chi muc và quản lý ảnh số chuẩn

Thông thường các ảnh được lưu trữ trong CSDL sử dụng đưới dạng các

thông tin thuộc tính Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể

cung cấp cho người sử dụng từ khoá tìm kiếm lướt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ như ngôn ngữ truy vấn cấu trác (SQL) Tuy nhiên,

nhìn từ bên ngoài có hạn chế; một trong những hạn chế đố là thời gian tính toán

khi CSDL lớn, nó dường như không thể chú giải thủ công tất cả các ảnh Mặt

khác các đặc trưng thị giác của ảnh rất khó mô tá bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đố

là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động

hoá Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR) CBIR được giới thiệu như phần bổ xung cho việc tiến tới đánh chỉ mục

thuộc tính truyền thống, nó là cần thiết để cấu thành CSDL multimedia Vi nhiing

Trang 5

1.3.1.6 Khoảng cách bậc hai

1.3.1.7 Khoảng cách Mahalanobis

2.Thực hiện phép đo

oT ĐỘ nhay và độ chính xác(RPP)

2 Tỷ lệ trọng số thành công (PWII- Percentage or Weighted Tlits}

13 3 2, 3 Phần trăm của thứ bậc Biống nhau PSR -Percentage of Similarity

2.1 Cluster có thứ bậc và đánh giá giá trị

2.L.L.Giá trị nhóm Contrario see

2.3 Kết cấu nhóm và không gian tương ing

2.3.1 Tại sao phải tách kết cấu không gian

.3.2 Đối sánh nhân tố hình dạng

Biến đổi mô tả

.1 Trường hợp tương đồng

2.3.3.2 Trường hợp biến đổi mối quan hệ

2.3.4 Cluster cổ ý nghĩa của biến đổi

2.3.4.1 Phén do sự không Lương dương sit các biến đổi

3.1.1 Phương pháp hình dạng trái ngược íc phương Phe t nén

3.1.2 Phương tiức quyết định Contrario

3.1.3 Ước lượng xác suất cảnh báo sai

Trang 6

Hình 3.6: Mã hoá sự tương đồng không dổi

Hình 4.1: Ảnh và mức đường có ý nghĩa

Hình 4.2: Thử nghiệm hitchcook

Tĩnh 4.3: Phương pháp nhận dạng bán cục bộ quan hệ không đổi seo R3

Hình 4.4: Phương pháp nhận dạng quan hệ bán cục bộ không đổi

Hình 4.9: Ảnh Menima và mức đường có ý nghĩa

Trang 7

DANH MUC CAC TU VIET TAT

Cơ sở dữ liệu

Number of Fasle Alarm Pridicion Fasle Alarm Fourie Transform

NFA of region

NFA of region-region Proposition

Probability of False Alarm

Trang 8

DANH MUC CAC TU VIET TAT

Cơ sở dữ liệu

Number of Fasle Alarm Pridicion Fasle Alarm Fourie Transform

NFA of region

NFA of region-region Proposition

Probability of False Alarm

Trang 9

1.3.1.6 Khoảng cách bậc hai

1.3.1.7 Khoảng cách Mahalanobis

2.Thực hiện phép đo

oT ĐỘ nhay và độ chính xác(RPP)

2 Tỷ lệ trọng số thành công (PWII- Percentage or Weighted Tlits}

13 3 2, 3 Phần trăm của thứ bậc Biống nhau PSR -Percentage of Similarity

2.1 Cluster có thứ bậc và đánh giá giá trị

2.L.L.Giá trị nhóm Contrario see

2.3 Kết cấu nhóm và không gian tương ing

2.3.1 Tại sao phải tách kết cấu không gian

.3.2 Đối sánh nhân tố hình dạng

Biến đổi mô tả

.1 Trường hợp tương đồng

2.3.3.2 Trường hợp biến đổi mối quan hệ

2.3.4 Cluster cổ ý nghĩa của biến đổi

2.3.4.1 Phén do sự không Lương dương sit các biến đổi

3.1.1 Phương pháp hình dạng trái ngược íc phương Phe t nén

3.1.2 Phương tiức quyết định Contrario

3.1.3 Ước lượng xác suất cảnh báo sai

Trang 10

Hình 1.1: Đối tượng bị làm nhiễu bởi biến đổi phé

Hình 1.2: Ảnh và các biến đổi khác

Hình 1.3: Điểm qua Ô tại vị trí x và độ chia t của tín hiệu

Tĩnh L.4: (a) Khoảng cách Ocolit,

(bì khoảng cách Cosin, (c) khoảng cách T.!

Hình 1:a) Ảnh ký tứb) mức dường tương ứng, e) Đoạn mức đường Hình 2.2: Nhóm dữ liệu 950 diểm dồng dang Tĩnh 2.5: Vấn để quan trọng của phân bố phương thức nên

Hình 2.6: Phân đoạn ảnh đã scan và 71 dường mức có mức ý nghĩa cực dại 44

Ifinh 2.7: Nhóm với mối quan hệ tới hướng

Hình 2.8: Nhóm trong không gian(toa dộ x, hướng) Tĩnh 2.9: Thử nghiệm Guemica "— serreeee.ỂỆ Hình 2.10: 'Thử nghiệm "" Guerniea " quan hệ tương ứng ý nghĩa không đổi 42

Thnh 2.L1: Hai đoạn mức đường và khung tương ứng

Hình 2.12: Thử nghiệm “ Guernica “

Hình 3.1: Trích chọn mức đường cố ý nghĩa Tình 3.3: Mã hoá sự không đổi tương đương bán cục bộ

Hình 3.4 : Mã hóa bán cục bộ mối quan hệ không đổi

Tình 3.5 : Mã hóa hình dạng bán cục bộ quan hệ bất biến

Trang 11

DANH MUC CAC TU VIET TAT

Cơ sở dữ liệu

Number of Fasle Alarm Pridicion Fasle Alarm Fourie Transform

NFA of region

NFA of region-region Proposition

Probability of False Alarm

Trang 12

Hình 1.1: Đối tượng bị làm nhiễu bởi biến đổi phé

Hình 1.2: Ảnh và các biến đổi khác

Hình 1.3: Điểm qua Ô tại vị trí x và độ chia t của tín hiệu

Tĩnh L.4: (a) Khoảng cách Ocolit,

(bì khoảng cách Cosin, (c) khoảng cách T.!

Hình 1:a) Ảnh ký tứb) mức dường tương ứng, e) Đoạn mức đường Hình 2.2: Nhóm dữ liệu 950 diểm dồng dang Tĩnh 2.5: Vấn để quan trọng của phân bố phương thức nên

Hình 2.6: Phân đoạn ảnh đã scan và 71 dường mức có mức ý nghĩa cực dại 44

Ifinh 2.7: Nhóm với mối quan hệ tới hướng

Hình 2.8: Nhóm trong không gian(toa dộ x, hướng) Tĩnh 2.9: Thử nghiệm Guemica "— serreeee.ỂỆ Hình 2.10: 'Thử nghiệm "" Guerniea " quan hệ tương ứng ý nghĩa không đổi 42

Thnh 2.L1: Hai đoạn mức đường và khung tương ứng

Hình 2.12: Thử nghiệm “ Guernica “

Hình 3.1: Trích chọn mức đường cố ý nghĩa Tình 3.3: Mã hoá sự không đổi tương đương bán cục bộ

Hình 3.4 : Mã hóa bán cục bộ mối quan hệ không đổi

Tình 3.5 : Mã hóa hình dạng bán cục bộ quan hệ bất biến

Trang 13

-10-

tiêm nang tứng dụng rộng rãi của nó, CBIR đã thu hút dược số lượng lớn các chú

ý trong những năm gần đây (KATT 92, NIB 93, YOS 99)

"Trong CBEIR, ảnh trong CSDI là dữ liệu không cấu trúc, ảnh số hoàn toàn

chi bao gồm mảng các pixel độ chối, không có ý nghĩ vốn có Một trong những

chìa khoá bất nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, dể phản ánh ngữ nghĩa ảnh Vì vậy việc trích chọn hiệu quả các đặc trưng ngữ nghĩa đó là điểu cốt yếu sự thành công của CBIR Nghiên cứu trên

những yêu cầu của người sử dụng đối với ảnh từ bộ sưu tập ánh biểu thị những

đặc trưng nguyên thuỷ đồ như màu sắc, kết cấu, hình dạng hoặc hỗn hợp của

chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (BAK 99) Những đặc

trưng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài Vì vậy đặc trưng

nguyên thuỷ của ảnh ở mức thấp có thể được bắt nguồn và khai thác để khuyến

khích việc CDIR tự động hoá

*Đối trợng nghiên cứu

các thông tin cơ bản trên đây các ảnh trong CSDL, có thể được đánh chỉ

mục bảng cách sử đụng thông tin thuộc tính hoặc thông tin ngữ nghĩa Ngữ nghĩa

của ảnh có thể được mô tả sử đụng các đặc trưng nguyên thuỷ; ví dụ: màu sắc,

cẩu trúc, hình đạng hoặc tổ hợp của chúng Kết quả nghiên cứu này chấn nhận tiến tới CHIR, đồ là việc đánh chỉ mục và tì kiếm ảnh bằng ngữ nghĩa của ảnh Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình

dạng Mục đích chủ yếu của cách im kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng Điều tra các công nghệ và

phát triển trung nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ fìm kiếm nhãn mác, nhận dạng đối tượng hoặc cố thể hợp nhất

trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc

trưng hỗn hợp của ảnh.

Trang 14

1.3.1.6 Khoảng cách bậc hai

1.3.1.7 Khoảng cách Mahalanobis

2.Thực hiện phép đo

oT ĐỘ nhay và độ chính xác(RPP)

2 Tỷ lệ trọng số thành công (PWII- Percentage or Weighted Tlits}

13 3 2, 3 Phần trăm của thứ bậc Biống nhau PSR -Percentage of Similarity

2.1 Cluster có thứ bậc và đánh giá giá trị

2.L.L.Giá trị nhóm Contrario see

2.3 Kết cấu nhóm và không gian tương ing

2.3.1 Tại sao phải tách kết cấu không gian

.3.2 Đối sánh nhân tố hình dạng

Biến đổi mô tả

.1 Trường hợp tương đồng

2.3.3.2 Trường hợp biến đổi mối quan hệ

2.3.4 Cluster cổ ý nghĩa của biến đổi

2.3.4.1 Phén do sự không Lương dương sit các biến đổi

3.1.1 Phương pháp hình dạng trái ngược íc phương Phe t nén

3.1.2 Phương tiức quyết định Contrario

3.1.3 Ước lượng xác suất cảnh báo sai

Trang 15

LOI NOI DAU

Ngày nay thông tin nói chưng sử dụng trong ảnh là phổ biến Rất nhiều lĩnh vực sử dụng ảnh như một công cụ để thực hiện công việc

Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn

thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng như

trạm vệ tỉnh, khó khăn trong lưu trỡ, chi phí cao cho xử lý và internet Sự đa dạng

các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số Các ứng dụng của ảnh bao gồm: giải trí số, thư viện số, gido dye va World Wide Web (www) Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc Lợi ích trước mắt của ảnh

số gồm cả mật xã hội và thương mại Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiên bạc Tuy nhiên, độ lớn của kho lưu trữ ảnh số trên

toàn thế giới có giới hạn, sự tận dụng ánh số từ CSDL hiện tại khó hơn Điều này

là vì thiếu cách đánh chi muc và quản lý ảnh số chuẩn

Thông thường các ảnh được lưu trữ trong CSDL sử dụng đưới dạng các

thông tin thuộc tính Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể

cung cấp cho người sử dụng từ khoá tìm kiếm lướt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ như ngôn ngữ truy vấn cấu trác (SQL) Tuy nhiên,

nhìn từ bên ngoài có hạn chế; một trong những hạn chế đố là thời gian tính toán

khi CSDL lớn, nó dường như không thể chú giải thủ công tất cả các ảnh Mặt

khác các đặc trưng thị giác của ảnh rất khó mô tá bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đố

là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động

hoá Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR) CBIR được giới thiệu như phần bổ xung cho việc tiến tới đánh chỉ mục

thuộc tính truyền thống, nó là cần thiết để cấu thành CSDL multimedia Vi nhiing

Trang 16

LOI NOI DAU

Ngày nay thông tin nói chưng sử dụng trong ảnh là phổ biến Rất nhiều lĩnh vực sử dụng ảnh như một công cụ để thực hiện công việc

Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn

thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng như

trạm vệ tỉnh, khó khăn trong lưu trỡ, chi phí cao cho xử lý và internet Sự đa dạng

các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số Các ứng dụng của ảnh bao gồm: giải trí số, thư viện số, gido dye va World Wide Web (www) Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc Lợi ích trước mắt của ảnh

số gồm cả mật xã hội và thương mại Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiên bạc Tuy nhiên, độ lớn của kho lưu trữ ảnh số trên

toàn thế giới có giới hạn, sự tận dụng ánh số từ CSDL hiện tại khó hơn Điều này

là vì thiếu cách đánh chi muc và quản lý ảnh số chuẩn

Thông thường các ảnh được lưu trữ trong CSDL sử dụng đưới dạng các

thông tin thuộc tính Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể

cung cấp cho người sử dụng từ khoá tìm kiếm lướt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ như ngôn ngữ truy vấn cấu trác (SQL) Tuy nhiên,

nhìn từ bên ngoài có hạn chế; một trong những hạn chế đố là thời gian tính toán

khi CSDL lớn, nó dường như không thể chú giải thủ công tất cả các ảnh Mặt

khác các đặc trưng thị giác của ảnh rất khó mô tá bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đố

là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động

hoá Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR) CBIR được giới thiệu như phần bổ xung cho việc tiến tới đánh chỉ mục

thuộc tính truyền thống, nó là cần thiết để cấu thành CSDL multimedia Vi nhiing

Trang 17

DANH MUC CAC TU VIET TAT

Cơ sở dữ liệu

Number of Fasle Alarm Pridicion Fasle Alarm Fourie Transform

NFA of region

NFA of region-region Proposition

Probability of False Alarm

Trang 18

DANH MUC CAC TU VIET TAT

Cơ sở dữ liệu

Number of Fasle Alarm Pridicion Fasle Alarm Fourie Transform

NFA of region

NFA of region-region Proposition

Probability of False Alarm

Trang 19

1.3.1.6 Khoảng cách bậc hai

1.3.1.7 Khoảng cách Mahalanobis

2.Thực hiện phép đo

oT ĐỘ nhay và độ chính xác(RPP)

2 Tỷ lệ trọng số thành công (PWII- Percentage or Weighted Tlits}

13 3 2, 3 Phần trăm của thứ bậc Biống nhau PSR -Percentage of Similarity

2.1 Cluster có thứ bậc và đánh giá giá trị

2.L.L.Giá trị nhóm Contrario see

2.3 Kết cấu nhóm và không gian tương ing

2.3.1 Tại sao phải tách kết cấu không gian

.3.2 Đối sánh nhân tố hình dạng

Biến đổi mô tả

.1 Trường hợp tương đồng

2.3.3.2 Trường hợp biến đổi mối quan hệ

2.3.4 Cluster cổ ý nghĩa của biến đổi

2.3.4.1 Phén do sự không Lương dương sit các biến đổi

3.1.1 Phương pháp hình dạng trái ngược íc phương Phe t nén

3.1.2 Phương tiức quyết định Contrario

3.1.3 Ước lượng xác suất cảnh báo sai

Trang 20

1.3.1.6 Khoảng cách bậc hai

1.3.1.7 Khoảng cách Mahalanobis

2.Thực hiện phép đo

oT ĐỘ nhay và độ chính xác(RPP)

2 Tỷ lệ trọng số thành công (PWII- Percentage or Weighted Tlits}

13 3 2, 3 Phần trăm của thứ bậc Biống nhau PSR -Percentage of Similarity

2.1 Cluster có thứ bậc và đánh giá giá trị

2.L.L.Giá trị nhóm Contrario see

2.3 Kết cấu nhóm và không gian tương ing

2.3.1 Tại sao phải tách kết cấu không gian

.3.2 Đối sánh nhân tố hình dạng

Biến đổi mô tả

.1 Trường hợp tương đồng

2.3.3.2 Trường hợp biến đổi mối quan hệ

2.3.4 Cluster cổ ý nghĩa của biến đổi

2.3.4.1 Phén do sự không Lương dương sit các biến đổi

3.1.1 Phương pháp hình dạng trái ngược íc phương Phe t nén

3.1.2 Phương tiức quyết định Contrario

3.1.3 Ước lượng xác suất cảnh báo sai

Trang 21

-10-

tiêm nang tứng dụng rộng rãi của nó, CBIR đã thu hút dược số lượng lớn các chú

ý trong những năm gần đây (KATT 92, NIB 93, YOS 99)

"Trong CBEIR, ảnh trong CSDI là dữ liệu không cấu trúc, ảnh số hoàn toàn

chi bao gồm mảng các pixel độ chối, không có ý nghĩ vốn có Một trong những

chìa khoá bất nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, dể phản ánh ngữ nghĩa ảnh Vì vậy việc trích chọn hiệu quả các đặc trưng ngữ nghĩa đó là điểu cốt yếu sự thành công của CBIR Nghiên cứu trên

những yêu cầu của người sử dụng đối với ảnh từ bộ sưu tập ánh biểu thị những

đặc trưng nguyên thuỷ đồ như màu sắc, kết cấu, hình dạng hoặc hỗn hợp của

chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (BAK 99) Những đặc

trưng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài Vì vậy đặc trưng

nguyên thuỷ của ảnh ở mức thấp có thể được bắt nguồn và khai thác để khuyến

khích việc CDIR tự động hoá

*Đối trợng nghiên cứu

các thông tin cơ bản trên đây các ảnh trong CSDL, có thể được đánh chỉ

mục bảng cách sử đụng thông tin thuộc tính hoặc thông tin ngữ nghĩa Ngữ nghĩa

của ảnh có thể được mô tả sử đụng các đặc trưng nguyên thuỷ; ví dụ: màu sắc,

cẩu trúc, hình đạng hoặc tổ hợp của chúng Kết quả nghiên cứu này chấn nhận tiến tới CHIR, đồ là việc đánh chỉ mục và tì kiếm ảnh bằng ngữ nghĩa của ảnh Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình

dạng Mục đích chủ yếu của cách im kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng Điều tra các công nghệ và

phát triển trung nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ fìm kiếm nhãn mác, nhận dạng đối tượng hoặc cố thể hợp nhất

trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc

trưng hỗn hợp của ảnh.

Trang 22

LOI NOI DAU

Ngày nay thông tin nói chưng sử dụng trong ảnh là phổ biến Rất nhiều lĩnh vực sử dụng ảnh như một công cụ để thực hiện công việc

Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn

thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng như

trạm vệ tỉnh, khó khăn trong lưu trỡ, chi phí cao cho xử lý và internet Sự đa dạng

các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số Các ứng dụng của ảnh bao gồm: giải trí số, thư viện số, gido dye va World Wide Web (www) Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc Lợi ích trước mắt của ảnh

số gồm cả mật xã hội và thương mại Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiên bạc Tuy nhiên, độ lớn của kho lưu trữ ảnh số trên

toàn thế giới có giới hạn, sự tận dụng ánh số từ CSDL hiện tại khó hơn Điều này

là vì thiếu cách đánh chi muc và quản lý ảnh số chuẩn

Thông thường các ảnh được lưu trữ trong CSDL sử dụng đưới dạng các

thông tin thuộc tính Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể

cung cấp cho người sử dụng từ khoá tìm kiếm lướt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ như ngôn ngữ truy vấn cấu trác (SQL) Tuy nhiên,

nhìn từ bên ngoài có hạn chế; một trong những hạn chế đố là thời gian tính toán

khi CSDL lớn, nó dường như không thể chú giải thủ công tất cả các ảnh Mặt

khác các đặc trưng thị giác của ảnh rất khó mô tá bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đố

là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động

hoá Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR) CBIR được giới thiệu như phần bổ xung cho việc tiến tới đánh chỉ mục

thuộc tính truyền thống, nó là cần thiết để cấu thành CSDL multimedia Vi nhiing

Trang 23

Hình 1.1: Đối tượng bị làm nhiễu bởi biến đổi phé

Hình 1.2: Ảnh và các biến đổi khác

Hình 1.3: Điểm qua Ô tại vị trí x và độ chia t của tín hiệu

Tĩnh L.4: (a) Khoảng cách Ocolit,

Hình 1:a) Ảnh ký tứb) mức dường tương ứng, e) Đoạn mức đường

Hình 2.2: Nhóm dữ liệu 950 diểm dồng dang

Tĩnh 2.5: Vấn để quan trọng của phân bố phương thức nên

Hình 2.6: Phân đoạn ảnh đã scan và 71 dường mức có mức ý nghĩa cực dại 44

Ifinh 2.7: Nhóm với mối quan hệ tới hướng

Hình 2.8: Nhóm trong không gian(toa dộ x, hướng)

Tĩnh 2.9: Thử nghiệm Guemica "— serreeee.ỂỆ

Hình 2.10: 'Thử nghiệm "" Guerniea " quan hệ tương ứng ý nghĩa không đổi 42

Thnh 2.L1: Hai đoạn mức đường và khung tương ứng

Hình 3.4 : Mã hóa bán cục bộ mối quan hệ không đổi

Tình 3.5 : Mã hóa hình dạng bán cục bộ quan hệ bất biến

Trang 24

-10-

tiêm nang tứng dụng rộng rãi của nó, CBIR đã thu hút dược số lượng lớn các chú

ý trong những năm gần đây (KATT 92, NIB 93, YOS 99)

"Trong CBEIR, ảnh trong CSDI là dữ liệu không cấu trúc, ảnh số hoàn toàn

chi bao gồm mảng các pixel độ chối, không có ý nghĩ vốn có Một trong những

chìa khoá bất nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, dể phản ánh ngữ nghĩa ảnh Vì vậy việc trích chọn hiệu quả các đặc trưng ngữ nghĩa đó là điểu cốt yếu sự thành công của CBIR Nghiên cứu trên

những yêu cầu của người sử dụng đối với ảnh từ bộ sưu tập ánh biểu thị những

đặc trưng nguyên thuỷ đồ như màu sắc, kết cấu, hình dạng hoặc hỗn hợp của

chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (BAK 99) Những đặc

trưng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài Vì vậy đặc trưng

nguyên thuỷ của ảnh ở mức thấp có thể được bắt nguồn và khai thác để khuyến

khích việc CDIR tự động hoá

*Đối trợng nghiên cứu

các thông tin cơ bản trên đây các ảnh trong CSDL, có thể được đánh chỉ

mục bảng cách sử đụng thông tin thuộc tính hoặc thông tin ngữ nghĩa Ngữ nghĩa

của ảnh có thể được mô tả sử đụng các đặc trưng nguyên thuỷ; ví dụ: màu sắc,

cẩu trúc, hình đạng hoặc tổ hợp của chúng Kết quả nghiên cứu này chấn nhận tiến tới CHIR, đồ là việc đánh chỉ mục và tì kiếm ảnh bằng ngữ nghĩa của ảnh Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình

dạng Mục đích chủ yếu của cách im kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng Điều tra các công nghệ và

phát triển trung nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ fìm kiếm nhãn mác, nhận dạng đối tượng hoặc cố thể hợp nhất

trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc

trưng hỗn hợp của ảnh.

Trang 25

LOI NOI DAU

Ngày nay thông tin nói chưng sử dụng trong ảnh là phổ biến Rất nhiều lĩnh vực sử dụng ảnh như một công cụ để thực hiện công việc

Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn

thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng như

trạm vệ tỉnh, khó khăn trong lưu trỡ, chi phí cao cho xử lý và internet Sự đa dạng

các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số Các ứng dụng của ảnh bao gồm: giải trí số, thư viện số, gido dye va World Wide Web (www) Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc Lợi ích trước mắt của ảnh

số gồm cả mật xã hội và thương mại Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiên bạc Tuy nhiên, độ lớn của kho lưu trữ ảnh số trên

toàn thế giới có giới hạn, sự tận dụng ánh số từ CSDL hiện tại khó hơn Điều này

là vì thiếu cách đánh chi muc và quản lý ảnh số chuẩn

Thông thường các ảnh được lưu trữ trong CSDL sử dụng đưới dạng các

thông tin thuộc tính Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể

cung cấp cho người sử dụng từ khoá tìm kiếm lướt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ như ngôn ngữ truy vấn cấu trác (SQL) Tuy nhiên,

nhìn từ bên ngoài có hạn chế; một trong những hạn chế đố là thời gian tính toán

khi CSDL lớn, nó dường như không thể chú giải thủ công tất cả các ảnh Mặt

khác các đặc trưng thị giác của ảnh rất khó mô tá bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đố

là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động

hoá Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR) CBIR được giới thiệu như phần bổ xung cho việc tiến tới đánh chỉ mục

thuộc tính truyền thống, nó là cần thiết để cấu thành CSDL multimedia Vi nhiing

Trang 26

-10-

tiêm nang tứng dụng rộng rãi của nó, CBIR đã thu hút dược số lượng lớn các chú

ý trong những năm gần đây (KATT 92, NIB 93, YOS 99)

"Trong CBEIR, ảnh trong CSDI là dữ liệu không cấu trúc, ảnh số hoàn toàn

chi bao gồm mảng các pixel độ chối, không có ý nghĩ vốn có Một trong những

chìa khoá bất nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, dể phản ánh ngữ nghĩa ảnh Vì vậy việc trích chọn hiệu quả các đặc trưng ngữ nghĩa đó là điểu cốt yếu sự thành công của CBIR Nghiên cứu trên

những yêu cầu của người sử dụng đối với ảnh từ bộ sưu tập ánh biểu thị những

đặc trưng nguyên thuỷ đồ như màu sắc, kết cấu, hình dạng hoặc hỗn hợp của

chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (BAK 99) Những đặc

trưng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài Vì vậy đặc trưng

nguyên thuỷ của ảnh ở mức thấp có thể được bắt nguồn và khai thác để khuyến

khích việc CDIR tự động hoá

*Đối trợng nghiên cứu

các thông tin cơ bản trên đây các ảnh trong CSDL, có thể được đánh chỉ

mục bảng cách sử đụng thông tin thuộc tính hoặc thông tin ngữ nghĩa Ngữ nghĩa

của ảnh có thể được mô tả sử đụng các đặc trưng nguyên thuỷ; ví dụ: màu sắc,

cẩu trúc, hình đạng hoặc tổ hợp của chúng Kết quả nghiên cứu này chấn nhận tiến tới CHIR, đồ là việc đánh chỉ mục và tì kiếm ảnh bằng ngữ nghĩa của ảnh Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình

dạng Mục đích chủ yếu của cách im kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng Điều tra các công nghệ và

phát triển trung nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ fìm kiếm nhãn mác, nhận dạng đối tượng hoặc cố thể hợp nhất

trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc

trưng hỗn hợp của ảnh.

Trang 27

Hình 1.1: Đối tượng bị làm nhiễu bởi biến đổi phé

Hình 1.2: Ảnh và các biến đổi khác

Hình 1.3: Điểm qua Ô tại vị trí x và độ chia t của tín hiệu

Tĩnh L.4: (a) Khoảng cách Ocolit,

Hình 1:a) Ảnh ký tứb) mức dường tương ứng, e) Đoạn mức đường

Hình 2.2: Nhóm dữ liệu 950 diểm dồng dang

Tĩnh 2.5: Vấn để quan trọng của phân bố phương thức nên

Hình 2.6: Phân đoạn ảnh đã scan và 71 dường mức có mức ý nghĩa cực dại 44

Ifinh 2.7: Nhóm với mối quan hệ tới hướng

Hình 2.8: Nhóm trong không gian(toa dộ x, hướng)

Tĩnh 2.9: Thử nghiệm Guemica "— serreeee.ỂỆ

Hình 2.10: 'Thử nghiệm "" Guerniea " quan hệ tương ứng ý nghĩa không đổi 42

Thnh 2.L1: Hai đoạn mức đường và khung tương ứng

Hình 3.4 : Mã hóa bán cục bộ mối quan hệ không đổi

Tình 3.5 : Mã hóa hình dạng bán cục bộ quan hệ bất biến

Trang 28

Hình 3.6: Mã hoá sự tương đồng không dổi

Hình 4.1: Ảnh và mức đường có ý nghĩa

Hình 4.2: Thử nghiệm hitchcook

Tĩnh 4.3: Phương pháp nhận dạng bán cục bộ quan hệ không đổi seo R3

Hình 4.4: Phương pháp nhận dạng quan hệ bán cục bộ không đổi

Hình 4.9: Ảnh Menima và mức đường có ý nghĩa

Trang 29

-10-

tiêm nang tứng dụng rộng rãi của nó, CBIR đã thu hút dược số lượng lớn các chú

ý trong những năm gần đây (KATT 92, NIB 93, YOS 99)

"Trong CBEIR, ảnh trong CSDI là dữ liệu không cấu trúc, ảnh số hoàn toàn

chi bao gồm mảng các pixel độ chối, không có ý nghĩ vốn có Một trong những

chìa khoá bất nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, dể phản ánh ngữ nghĩa ảnh Vì vậy việc trích chọn hiệu quả các đặc trưng ngữ nghĩa đó là điểu cốt yếu sự thành công của CBIR Nghiên cứu trên

những yêu cầu của người sử dụng đối với ảnh từ bộ sưu tập ánh biểu thị những

đặc trưng nguyên thuỷ đồ như màu sắc, kết cấu, hình dạng hoặc hỗn hợp của

chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (BAK 99) Những đặc

trưng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài Vì vậy đặc trưng

nguyên thuỷ của ảnh ở mức thấp có thể được bắt nguồn và khai thác để khuyến

khích việc CDIR tự động hoá

*Đối trợng nghiên cứu

các thông tin cơ bản trên đây các ảnh trong CSDL, có thể được đánh chỉ

mục bảng cách sử đụng thông tin thuộc tính hoặc thông tin ngữ nghĩa Ngữ nghĩa

của ảnh có thể được mô tả sử đụng các đặc trưng nguyên thuỷ; ví dụ: màu sắc,

cẩu trúc, hình đạng hoặc tổ hợp của chúng Kết quả nghiên cứu này chấn nhận tiến tới CHIR, đồ là việc đánh chỉ mục và tì kiếm ảnh bằng ngữ nghĩa của ảnh Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình

dạng Mục đích chủ yếu của cách im kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng Điều tra các công nghệ và

phát triển trung nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ fìm kiếm nhãn mác, nhận dạng đối tượng hoặc cố thể hợp nhất

trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc

trưng hỗn hợp của ảnh.

Trang 30

-10-

tiêm nang tứng dụng rộng rãi của nó, CBIR đã thu hút dược số lượng lớn các chú

ý trong những năm gần đây (KATT 92, NIB 93, YOS 99)

"Trong CBEIR, ảnh trong CSDI là dữ liệu không cấu trúc, ảnh số hoàn toàn

chi bao gồm mảng các pixel độ chối, không có ý nghĩ vốn có Một trong những

chìa khoá bất nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, dể phản ánh ngữ nghĩa ảnh Vì vậy việc trích chọn hiệu quả các đặc trưng ngữ nghĩa đó là điểu cốt yếu sự thành công của CBIR Nghiên cứu trên

những yêu cầu của người sử dụng đối với ảnh từ bộ sưu tập ánh biểu thị những

đặc trưng nguyên thuỷ đồ như màu sắc, kết cấu, hình dạng hoặc hỗn hợp của

chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (BAK 99) Những đặc

trưng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài Vì vậy đặc trưng

nguyên thuỷ của ảnh ở mức thấp có thể được bắt nguồn và khai thác để khuyến

khích việc CDIR tự động hoá

*Đối trợng nghiên cứu

các thông tin cơ bản trên đây các ảnh trong CSDL, có thể được đánh chỉ

mục bảng cách sử đụng thông tin thuộc tính hoặc thông tin ngữ nghĩa Ngữ nghĩa

của ảnh có thể được mô tả sử đụng các đặc trưng nguyên thuỷ; ví dụ: màu sắc,

cẩu trúc, hình đạng hoặc tổ hợp của chúng Kết quả nghiên cứu này chấn nhận tiến tới CHIR, đồ là việc đánh chỉ mục và tì kiếm ảnh bằng ngữ nghĩa của ảnh Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình

dạng Mục đích chủ yếu của cách im kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng Điều tra các công nghệ và

phát triển trung nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ fìm kiếm nhãn mác, nhận dạng đối tượng hoặc cố thể hợp nhất

trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc

trưng hỗn hợp của ảnh.

Trang 31

3.4.4, Luat ra quyết dinh Contrario “

3.2 Tự động thiết lập ngưỡng khoảng cách

3.2.1 Số các cảnh báo sai NFA

3.2.2 Đối sánh có ý nghĩa

3.2.3 Ngưỡng nhận đạng tương ứng với ngữ cảnh

3.2.4 Tại sao quyết định Contrario

3.4 Xây dựng đặc trưng độc lập thống kê

3.4.Chuẩn hóa nhân tổ hình dạng từ ảnh cho đặc trưng độc lập

3.4.1 Biểu diễn hình dạng bằng các mức đường sees

3.4.2.Tiêu chuẩn hóa và mã hóa bán cục bộ

3.4.2.1 Mã hóa / Tiêu chuẩn hóa trị không đổi tương dương

3.4.2.2 Mã hóa / Chuẩn hóa quan hệ bất biến ¬

3.'Từ chuẩn hóa nhân tố hình dạng đến đặc trưng độc lập

3.5 Thảo luận TH HH ng rau

4.2 Thử nghiệm phương pháp Contrario

4.2.1 Hai ảnh không quan hệ với nhau

Tầi liệu tham khảo 89

Trang 32

Hình 1.1: Đối tượng bị làm nhiễu bởi biến đổi phé

Hình 1.2: Ảnh và các biến đổi khác

Hình 1.3: Điểm qua Ô tại vị trí x và độ chia t của tín hiệu

Tĩnh L.4: (a) Khoảng cách Ocolit,

Hình 1:a) Ảnh ký tứb) mức dường tương ứng, e) Đoạn mức đường

Hình 2.2: Nhóm dữ liệu 950 diểm dồng dang

Tĩnh 2.5: Vấn để quan trọng của phân bố phương thức nên

Hình 2.6: Phân đoạn ảnh đã scan và 71 dường mức có mức ý nghĩa cực dại 44

Ifinh 2.7: Nhóm với mối quan hệ tới hướng

Hình 2.8: Nhóm trong không gian(toa dộ x, hướng)

Tĩnh 2.9: Thử nghiệm Guemica "— serreeee.ỂỆ

Hình 2.10: 'Thử nghiệm "" Guerniea " quan hệ tương ứng ý nghĩa không đổi 42

Thnh 2.L1: Hai đoạn mức đường và khung tương ứng

Hình 3.4 : Mã hóa bán cục bộ mối quan hệ không đổi

Tình 3.5 : Mã hóa hình dạng bán cục bộ quan hệ bất biến

Trang 33

3.4.4, Luat ra quyết dinh Contrario “

3.2 Tự động thiết lập ngưỡng khoảng cách

3.2.1 Số các cảnh báo sai NFA

3.2.2 Đối sánh có ý nghĩa

3.2.3 Ngưỡng nhận đạng tương ứng với ngữ cảnh

3.2.4 Tại sao quyết định Contrario

3.4 Xây dựng đặc trưng độc lập thống kê

3.4.Chuẩn hóa nhân tổ hình dạng từ ảnh cho đặc trưng độc lập

3.4.1 Biểu diễn hình dạng bằng các mức đường sees

3.4.2.Tiêu chuẩn hóa và mã hóa bán cục bộ

3.4.2.1 Mã hóa / Tiêu chuẩn hóa trị không đổi tương dương

3.4.2.2 Mã hóa / Chuẩn hóa quan hệ bất biến ¬

3.'Từ chuẩn hóa nhân tố hình dạng đến đặc trưng độc lập

3.5 Thảo luận TH HH ng rau

4.2 Thử nghiệm phương pháp Contrario

4.2.1 Hai ảnh không quan hệ với nhau

Tầi liệu tham khảo 89

Trang 34

-10-

tiêm nang tứng dụng rộng rãi của nó, CBIR đã thu hút dược số lượng lớn các chú

ý trong những năm gần đây (KATT 92, NIB 93, YOS 99)

"Trong CBEIR, ảnh trong CSDI là dữ liệu không cấu trúc, ảnh số hoàn toàn

chi bao gồm mảng các pixel độ chối, không có ý nghĩ vốn có Một trong những

chìa khoá bất nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, dể phản ánh ngữ nghĩa ảnh Vì vậy việc trích chọn hiệu quả các đặc trưng ngữ nghĩa đó là điểu cốt yếu sự thành công của CBIR Nghiên cứu trên

những yêu cầu của người sử dụng đối với ảnh từ bộ sưu tập ánh biểu thị những

đặc trưng nguyên thuỷ đồ như màu sắc, kết cấu, hình dạng hoặc hỗn hợp của

chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (BAK 99) Những đặc

trưng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài Vì vậy đặc trưng

nguyên thuỷ của ảnh ở mức thấp có thể được bắt nguồn và khai thác để khuyến

khích việc CDIR tự động hoá

*Đối trợng nghiên cứu

các thông tin cơ bản trên đây các ảnh trong CSDL, có thể được đánh chỉ

mục bảng cách sử đụng thông tin thuộc tính hoặc thông tin ngữ nghĩa Ngữ nghĩa

của ảnh có thể được mô tả sử đụng các đặc trưng nguyên thuỷ; ví dụ: màu sắc,

cẩu trúc, hình đạng hoặc tổ hợp của chúng Kết quả nghiên cứu này chấn nhận tiến tới CHIR, đồ là việc đánh chỉ mục và tì kiếm ảnh bằng ngữ nghĩa của ảnh Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình

dạng Mục đích chủ yếu của cách im kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng Điều tra các công nghệ và

phát triển trung nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ fìm kiếm nhãn mác, nhận dạng đối tượng hoặc cố thể hợp nhất

trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc

trưng hỗn hợp của ảnh.

Trang 35

LOI NOI DAU

Ngày nay thông tin nói chưng sử dụng trong ảnh là phổ biến Rất nhiều lĩnh vực sử dụng ảnh như một công cụ để thực hiện công việc

Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn

thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng như

trạm vệ tỉnh, khó khăn trong lưu trỡ, chi phí cao cho xử lý và internet Sự đa dạng

các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số Các ứng dụng của ảnh bao gồm: giải trí số, thư viện số, gido dye va World Wide Web (www) Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc Lợi ích trước mắt của ảnh

số gồm cả mật xã hội và thương mại Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiên bạc Tuy nhiên, độ lớn của kho lưu trữ ảnh số trên

toàn thế giới có giới hạn, sự tận dụng ánh số từ CSDL hiện tại khó hơn Điều này

là vì thiếu cách đánh chi muc và quản lý ảnh số chuẩn

Thông thường các ảnh được lưu trữ trong CSDL sử dụng đưới dạng các

thông tin thuộc tính Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể

cung cấp cho người sử dụng từ khoá tìm kiếm lướt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ như ngôn ngữ truy vấn cấu trác (SQL) Tuy nhiên,

nhìn từ bên ngoài có hạn chế; một trong những hạn chế đố là thời gian tính toán

khi CSDL lớn, nó dường như không thể chú giải thủ công tất cả các ảnh Mặt

khác các đặc trưng thị giác của ảnh rất khó mô tá bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đố

là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động

hoá Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR) CBIR được giới thiệu như phần bổ xung cho việc tiến tới đánh chỉ mục

thuộc tính truyền thống, nó là cần thiết để cấu thành CSDL multimedia Vi nhiing

Trang 36

3.4.4, Luat ra quyết dinh Contrario “

3.2 Tự động thiết lập ngưỡng khoảng cách

3.2.1 Số các cảnh báo sai NFA

3.2.2 Đối sánh có ý nghĩa

3.2.3 Ngưỡng nhận đạng tương ứng với ngữ cảnh

3.2.4 Tại sao quyết định Contrario

3.4 Xây dựng đặc trưng độc lập thống kê

3.4.Chuẩn hóa nhân tổ hình dạng từ ảnh cho đặc trưng độc lập

3.4.1 Biểu diễn hình dạng bằng các mức đường sees

3.4.2.Tiêu chuẩn hóa và mã hóa bán cục bộ

3.4.2.1 Mã hóa / Tiêu chuẩn hóa trị không đổi tương dương

3.4.2.2 Mã hóa / Chuẩn hóa quan hệ bất biến ¬

3.'Từ chuẩn hóa nhân tố hình dạng đến đặc trưng độc lập

3.5 Thảo luận TH HH ng rau

4.2 Thử nghiệm phương pháp Contrario

4.2.1 Hai ảnh không quan hệ với nhau

Tầi liệu tham khảo 89

Trang 37

3.4.4, Luat ra quyết dinh Contrario “

3.2 Tự động thiết lập ngưỡng khoảng cách

3.2.1 Số các cảnh báo sai NFA

3.2.2 Đối sánh có ý nghĩa

3.2.3 Ngưỡng nhận đạng tương ứng với ngữ cảnh

3.2.4 Tại sao quyết định Contrario

3.4 Xây dựng đặc trưng độc lập thống kê

3.4.Chuẩn hóa nhân tổ hình dạng từ ảnh cho đặc trưng độc lập

3.4.1 Biểu diễn hình dạng bằng các mức đường sees

3.4.2.Tiêu chuẩn hóa và mã hóa bán cục bộ

3.4.2.1 Mã hóa / Tiêu chuẩn hóa trị không đổi tương dương

3.4.2.2 Mã hóa / Chuẩn hóa quan hệ bất biến ¬

3.'Từ chuẩn hóa nhân tố hình dạng đến đặc trưng độc lập

3.5 Thảo luận TH HH ng rau

4.2 Thử nghiệm phương pháp Contrario

4.2.1 Hai ảnh không quan hệ với nhau

Tầi liệu tham khảo 89

Ngày đăng: 22/06/2025, 01:10

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w