1. Trang chủ
  2. » Luận Văn - Báo Cáo

CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH

68 356 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 1,95 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

nên thường dẫn tới sự không chính xác; trong khi đó với phương pháp tra cứu ảnh dựa vào đặc trưng lại phụ thuộc vào cách mà người dùng rút trích đặc trưng, mà một ảnh số được cấu thành b

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

Phạm Văn Cường

CÁC ĐẶC TRƯNG HÌNH ẢNH TRONG

CƠ SỞ DỮ LIỆU ẢNH

LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH

Thái Nguyên, Năm 2011

Trang 2

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS ĐỖ TRUNG TUẤN

Thái Nguyên, năm 2011

Trang 3

LỜI CẢM ƠN

Trước hết tôi xin được bày tỏ lòng cảm ơn sâu sắc và sự kính trọng của mình đến các thầy cô giáo Trường Đại học Công nghệ Thông tin và Truyền thông, Đại học Thái Nguyên, các thầy cô giáo Viện công nghệ thông tin thuộc Viện công nghệ Việt Nam đặc biệt là các thầy cô giáo đã giảng dạy và giúp đỡ tôi trong suốt quá trình học tập nâng cao sau đại học

Nhân dịp hoàn thành luận văn tốt nghiệp cao học của mình, tôi xin trân trọng cảm ơn thầy giáo PGS-TS Đỗ Trung Tuấn- Trường Đại học Khoa Học Tự Nhiên thuộc trường Đại học Quốc Gia Hà Nội đã nhiệt tình hướng dẫn để tôi hoàn thành luận văn này

Tôi xin cảm ơn bạn bè, đồng nghiệp tại Thanh Hóa, đã luôn động viên, giúp đỡ tôi trong quá trình học tập và công tác, để tôi học tập và hoàn thành luận văn này

Xin gửi đến người thân, gia đình tôi, những người đã tạo điều kiện và động viên, trợ giúp tôi về tinh thần, thông cảm và giúp đỡ tôi rất nhiều trong thời gian học tập này

Trang 4

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn khoa học của thầy giáo hướng dẫn Các số liệu, kết quả nêu trong luận văn là trung thực Những kết luận của luận văn chưa từng được ai công bố trong bất kỳ công trình nào khác

Thái Nguyên, ngày 01 tháng 10 năm 2011

Phạm Văn Cường

Trang 5

Mục lục

LỜI CẢM ƠN i

LỜI CAM ĐOAN ii

Mục lục iii

Danh mục kí hiệu và viết tắt v

Danh mục hình và bảng vi

MỞ ĐẦU 1

Chương 1 VAI TRÒ CỦA DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ VIỆC TRÍCH CHỌN ĐẶC TRƯNG 4

1.1 Các dữ liệu đa phương tiện và số hóa dữ liệu 4

1.1.1 Các dữ liệu đa phương tiện 4

1.1.2 Chỉ số hóa dữ liệu 6

1.2 Đặc trưng của dữ liệu hình ảnh 7

1.2.1 Giới thiệu 7

1.2.2 Đặc trưng và trích rút đặc trưng của ảnh số 8

1.2.3 Thông tin không gian 14

1.2.4 Các đặc trưng mức cao 15

1.3 Các nghiên cứu và ứng dụng liên quan đến cơ sở dữ liệu ảnh 16

1.3.1 Ảnh trong GIS 17

1.3.2 Đồ họa máy tính 18

1.3.3 Bản quyền về hình ảnh 19

1.4 Kết luận 23

Chương 2 TỔ CHỨC CƠ SỞ DỮ LIỆU ẢNH 24

2.1 Mô hình dữ liệu 24

2.1.1 Nhu cầu về mô hình dữ liệu 24

2.1.2 Các mô hình thí dụ 27

2.2 Kĩ thuật chỉ số hóa 30

2.3 Kĩ thuật tìm kiếm 30

Trang 6

2.3.1 Một số hệ thống 32

2.3.2 Tìm các đối tượng dựa trên hình dạng và từ khóa 36

2.3.3 Thể hiện hình dạng 38

2.3.4 Việc khớp các hình 38

2.4 Kết luận 39

Chương 3 TỔ CHỨC LƯU TRỮ ẢNH PHONG CẢNH THANH HÓA 40

3.1 Mô tả bài toán 40

3.1.1 Giới thiệu về quê hương Thanh Hóa 40

3.1.2 Đặt bài toán 47

3.2 Phân tích đặc trưng và nhu cầu về chỉ số hóa hình ảnh theo đặc trưng 47

3.2.1 Các thuộc tính của ảnh phong cảnh 47

3.2.2 Các thông tin liên quan đến ảnh 47

3.3 Thiết kế cơ sở dữ liệu 48

3.3.1 Bảng dữ liệu về thể loại ảnh 48

3.3.2 Bảng dữ liệu về tác giả ảnh 48

3.3.3 Bảng dữ liệu về giấy ảnh 48

3.3.4 Bảng dữ liệu về bộ sưu tập 49

3.3.5 Bảng dữ liệu về mô tả ảnh 49

3.3.6 Lược đồ quan hệ cơ sở dữ liệu 50

3.4 Khai thác cơ sở dữ liệu ảnh phong cảnh Thanh Hóa 50

3.4.1 Hạ tầng kĩ thuật 52

3.4.2 Một số màn hình giao diện 52

3.5 Kết luận 56

KẾT LUẬN 57

Một số vấn đề đã giải quyết 57

Phương hướng tiếp tục nghiên cứu 58

TÀI LIỆU THAM KHẢO 59

Trang 7

Danh mục kí hiệu và viết tắt

CBIR Content Based Image

CSDL Data Base Cơ sở dữ liệu

DBMS

GCH Global Color Histogram Lược đồ màu toàn cục

Các giá trị đánh giá màu sắc

IR Information Retrieve Hệ thống tìm kiếm thông tin

LCH Local Color Histogram Lược đồ màu cục bộ

MIRS Hệ thống tìm kiếm thông tin đa

phương tiện PCA Principal component analysis Phân tích thành phần chính

QBIC Query By Image Content Truy vấn theo nội dung ảnh

RGB Red Green Blue Đỏ Xanh xanh dương

TBIR Text Based Image Retrieval Tra cứu ảnh dựa vào văn bản mô

tả TBIR Text Based Image Retrieval Tìm ảnh dựa theo văn bản

Visual SEEK

Trang 8

Danh mục hình và bảng

Hình 1.1 Dữ liệu đa phương tiện 5

Hình 1.2 Màu RGB 9

Hình 1.3 Lược đồ màu CIE 1976 12

Hình 1.4 Các thành phần của GIS 17

Hình 1.5 Thiết kế đồ họa 18

Hình 1.6 Một số ảnh lựa chọn 20

Hình 2.1 Mô hình cơ sở dữ liệu đa phương tiện tổng quát 25

Hình 2.2 Mô hình dữ liệu VIMSYS 27

Hình 2.3 Mô hình dữ liệu video tổng quát 28

Hình 2.4 Mô hình tìm kiếm thông tin tổng quát 31

Hình 2.5 Tìm kiếm theo nội dung, dựa vào từ khóa, trên mô hình chuyển trạng thái 32

Hình 2.6 Tìm kiếm trong PICTION 32

Hình 2.7 Tìm kiếm trong QBIC 33

Hình 2.7 Hỏi theo nội dung với ngôn ngữ QBIC 34

Hình 2.8 Tìm kiếm trong CVQL 34

Hình 2.9 Hiển thị kết quả trong hệ thống VEVA 35

Hình 2.10 Thể hiện quĩ đạo 36

Hình 2.11 Một số bước xác định công việc trích đặc trưng ảnh 39

Hình 3.1 Bãi biển Hải Hoà, Tĩnh Gia 41

Hình 3.2 Vị trí tỉnh Thanh Hóa trên bản đồ đất nước 42

Hình 3.3 Tượng đài vua Lê Lợi 44

Hình 3.4 Suối cá Thanh Hóa 44

Bảng 3.1 Mô tả dữ liệu ảnh 48

Bảng 3.2 Mô tả dữ liệu liên quan đến nghệ sĩ nhiếp ảnh 48

Bảng 3.3 Dữ liệu về chất liệu ảnh 48

Bảng 3.4 Dữ liệu liên quan đến các bộ sưu tập ảnh, hình đồ họa 49

Bảng 3.5 Mô tả thông tin về ảnh, hình đồ họa 49

Trang 9

Hình 3.5 Lược đồ quan hệ của cơ sở dữ liệu 50

Hình 3.6 Truy cập cơ sở dữ liệu ảnh 51

Hình 3.7 Hệ quản trị cơ sở dữ liệu và mạng 52

Hình 3.8 Form cập nhật danh mục giấy ảnh 52

Hình 3.9 Form cập nhật bộ sưu tập ảnh 53

Hình 3.10 Form cập nhật thông tin ảnh 54

Hình 3.11 Form tìm kiếm và kết xuất các file ảnh 55

Hình 3.12 Form duyệt và xem ảnh 55

Trang 10

Mặt khác, với sự phát triển mạnh mẽ của công nghệ thông tin, đặc biệt là sự phát triển của mạng Internet làm cho số lượng ảnh số được lưu trữ và trao đổi qua Internet là rất lớn Do đó bài toán thực tế đặt ra là cần phải có phương pháp tổ chức cơ

sở dữ liệu ảnh phù hợp, cùng với việc tìm kiếm, tra cứu ảnh hiệu quả, có độ chính xác cao và có hiệu năng tốt

Việc tìm kiếm một bức ảnh thỏa mãn tiêu chí tìm kiếm trong vô số các bức ảnh thuộc đủ loại chủ đề và định dạng khác nhau là rất khó khăn, và khi số lượng ảnh trong một bộ cơ sở dữ liệu còn ít, việc nhận diện một bức ảnh hay việc so sánh sự giống và khác nhau giữa nhiều bức ảnh có thể thực hiện được bằng mắt thường, tuy nhiên khi số lượng ảnh rất lớn thì việc so sánh này rất khó khăn, và do đó cần có các phương pháp hiệu quả và phù hợp hơn

Trong thực tế, bài toán tra cứu ảnh số có rất nhiều ứng dụng quan trọng, ví dụ như bài toán „„Quản lý logo trong sở hữu trí tuệ‟‟, „„So sánh mẫu vân tay trong khoa học hình sự‟‟, „„Tìm kiếm danh lam thắng cảnh trong du lịch, địa lý‟‟, „„Xây dựng thư viện hình ảnh‟‟ Việc tìm ra các phương pháp tổ chức dữ liệu ảnh và cách thức tra cứu, tìm kiếm ảnh hiệu quả sẽ là điều kiện quan trọng để giải quyết các bài toán như trên Từ đó, việc tìm ra các phương pháp lưu trữ, cách thức tra cứu và xếp hạng các ảnh được lưu trên các thẻ nhớ hay trên các thiết bị lưu trữ là vấn đề có tính thiết thực và hiệu quả cao trong thực tiễn

Trang 11

Với các định dạnh ảnh số khác nhau sẽ có các phương pháp tra cứu ảnh hiệu quả khác nhau Hiện nay có hai xu hướng chính trong việc tra cứu ảnh số là tra cứu ảnh theo văn bản mô tả ảnh TRIR và tra cứu ảnh theo đặc trưng ảnh CBIR Một số công cụ tra cứu ảnh theo văn bản mô tả ảnh như Yahoo, MSN, Google Image Search và một

số công cụ tra cứu ảnh theo nội dung như Tineye, Bing, Google Image Swirl, Tiltomo

Mỗi phương pháp tra cứu ảnh đều có điểm mạnh và hạn chế riêng, ví dụ tra cứu ảnh theo văn bản mô tả phụ thuộc vào các văn bản mô tả ảnh - điều này lại phụ thuộc vào chủ quan của người dùng, sự không chính xác trong các văn bản mô tả nên thường dẫn tới sự không chính xác; trong khi đó với phương pháp tra cứu ảnh dựa vào đặc trưng lại phụ thuộc vào cách mà người dùng rút trích đặc trưng, mà một ảnh số được cấu thành bởi nhiều đặc trưng khác nhau như màu sắc, không gian màu, vân ảnh, kết cấu ảnh, hình dạng ảnh Do đó để việc tra cứu ảnh được hiệu quả, người ta thường lồng ghép các phương pháp tra cứu khác nhau một cách linh Hoạt và phù hợp

Phương pháp tra cứu ảnh được nhiều người quan tâm nghiên cứu hiện nay là kỹ thuật „„Tra cứu ảnh dựa theo nội dung‟‟ Kỹ thuật này cho phép trích rút các đặc trưng của ảnh dựa vào nội dung trực quan của bản thân ảnh như màu sắc, kết cấu, hình dạng

và bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp, tổ chức cơ sở dữ liệu ảnh Việc biểu diễn và trích rút đặc trưng để nhận dạng được bức ảnh mong muốn

ấy rất quan trọng và nhiều hướng nghiên cứu khác nhau đó được triển khai Một số hệ thống tra cứu ảnh nổi tiếng như QBIC (IBM), Virage (Virage Inc.), Photobook (MIT), Visual SEEK (Columbia University) đã áp dụng kỹ thuật này

Tuy nhiên, khi cơ sở dữ liệu ảnh lớn thì việc tìm kiếm ảnh bằng cách so sánh ảnh truy vấn với mỗi ảnh trong cơ sở dữ liệu sẽ tốn rất nhiều thời gian và không thể áp dụng được đối với các cơ sở dữ liệu ảnh lớn Thực tế đòi hỏi thời gian tìm kiếm không được tăng tuyến tính đối với số các ảnh trong cơ sở dữ liệu Chính vì lí do đó tôi chọn

đề tài “Các đặc trưng hình ảnh trong cơ sở dữ liệu ảnh”

Trang 12

Đề tài này nghiên cứu cơ sở lý thuyết và các ứng dụng chính của kỹ thuật tra cứu ảnh theo nội dung và kỹ thuật đánh chỉ số ảnh dựa vào phân cụm Trong kỹ thuật này, tại thời điểm truy vấn, ảnh truy vấn không so sánh với tất cả các ảnh trong cơ sở

dữ liệu, mà chỉ so sánh với một tập con rất nhỏ các ảnh Trên cơ sở đó thử nghiệm phương pháp cụ thể để xây dựng một chương trình phần mềm đọc vào một ảnh danh lam thắng cảnh mẫu và tìm kiếm những ảnh danh lam thắng cảnh tương tự với ảnh mẫu trong tập hợp các ảnh cho trước Kết quả thực hiện đề tài sẽ giúp cho việc tìm kiếm các ảnh danh lam thắng cảnh trong tập hợp các ảnh được nhanh hơn, đồng thời có thể làm

cơ sở cho việc xây dựng nên các hệ thống ứng dụng có tính thực tiễn cao phục vụ cho nhu cầu phát triển của xã hội và cho công tác nghiên cứu sau này

Sau phần mở đầu, nội dung của luận văn gồm 3 chương và phần kết luận:

đặc trưng” sẽ trình bày tổng quan về dữ liệu đa phương tiện và một số khía cạnh liên quan đến trích chọn nội dung

trình phân tích, thiết kế và cài đặt cơ sở dữ liệu ảnh

cảnh Thanh Hóa” thể hiện ứng dụng của việc tìm hiểu về cơ sở dữ liệu ảnh trong địa bàn công tác của học viên Các tư liệu ảnh của tỉnh Thanh Hóa được dùng làm dữ liệu cho cơ sở dữ liệu ảnh

Cuối cùng kết luận và danh sách các tài liệu tham khảo, sử dụng trong luận văn

Trang 13

Chương 1 VAI TRÒ CỦA DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ

VIỆC TRÍCH CHỌN ĐẶC TRƯNG

Chương 1 trình bày một số khái niệm liên quan đến dữ liệu đa phương tiện và ý nghĩa của việc trích chọn đặc trưng

1.1 Các dữ liệu đa phương tiện và số hóa dữ liệu

1.1.1 Các dữ liệu đa phương tiện

1.1.1.1 Giới thiệu về dữ liệu đa phương tiện

Dữ liệu đa phương tiện bao gồm: văn bản, đồ họa, Hoạt hình, âm thanh, video,… Trong đó có văn bản, âm thanh, hình ảnh và ảnh động

1 Văn bản (Text): Trong các ứng dụng đa phương tiện, văn bản hiện được sử dụng rộng dãi Nguyên nhân là do việc thể hiện văn bản trên màn hình có kích thước và

độ phân giải nhỏ rất thuận lợi Đồng thời có nhiều thông tin không thể hiện được bằng các công cụ đa phương tiện khác, khi đó văn bản là hình thức được sử dụng để thể hiện thông tin đó

2 Âm thanh (Sound) được xem gồm âm nhạc, tiếng động, tiếng nói Âm thanh: hay

âm nhạc cũng như các bài phát biểu có sức mạnh về mặt tạo cảm xúc Âm nhạc có thể kích thích tâm trạng tích cực trong phục hồi hoặc thư giản trí tuệ và cơ thể, trong khi đó âm thanh như là tiếng ồn tác động đến con người Sự kết hợp âm thanh với hình ảnh động sẽ thể hiện thể giới trực quan Tiếng nói là một dữ liệu có tính liên tục, tiếng nói có thể được sử dụng giới thiệu, trình bày, nêu yêu cầu.… Tiếng nói được coi như là công cụ giải thích bổ sung hữu hiệu cho văn bản

trạng của người quan sát có thể quyết định nội dung của hình ảnh, khi đó sự kết hợp giữa hình ảnh và âm thanh sẽ cho kết quả đầy đủ về nội dung thực Đồ họa (Graphic): là một thành phần đa phương tiện rất mạnh được sử dụng để thể hiện

Trang 14

ngữ cảnh Đồ họa là một kiểu dữ liệu độc lập, từ hình ảnh đồ họa có thể xác định được những khoảnh khắc (không gian) và thời gian Đồ họa là loại dữ liệu thích hợp cho việc nghiên cứu và phân tích các mối quan hệ Đồ họa có thể kết hợp với văn bản để mô tả đầy đủ về đối tượng Đồ họa thể hiện đối tượng chi tiết hơn so với hình ảnh và thể hiện tốt các đối tượng mang tính trừu tượng.

4 Hoạt hình (Animation): Hoạt hình cũng là một thành phần trong cơ sở dữ liệu đa phương tiện Hoạt hình có thể hiểu là các hình ảnh thay đổi, thể hiện sự thay đổi các thuộc tính của đối tượng trong một khoảng thời gian Hoạt hình đòi hỏi nhiều không gian bộ nhớ để lưu trữ hơn so với hình ảnh Video: là dữ liệu mạnh nhất của tất cả các loại dữ liệu đa phương tiện Nó có khả năng miêu tả đầy đủ về thể giới thực Nó giúp người xem hiểu và nhớ sâu sắc nội dung cần diễn đạt

Hình 1.1 Dữ liệu đa phương tiện

1.1.1.2 Phân loại dữ liệu đa phương tiện

Các dữ liệu đa phương tiện được chia thành hai lớp: lớp các dữ liệu không liên tục và lớp các dữ liệu liên tục

thuộc vào thời gian, các dữ liệu không liên tục gồm: dữ liệu văn bản không có cấu trúc hoặc có cấu trúc, các hình ảnh,…

Trang 15

 Các dữ liệu liên tục là những dữ liệu nội dung trình bày phụ thuộc vào thời gian, các dữ liệu liên tục gồm: tiếng nói, âm thanh, video, Hoạt hình,…

1.1.1.3 Các đặc tính của dữ liệu đa phương tiện

Các đặc tính chung của dữ liệu đa phương tiện gồm:

1 Không có cấu trúc ổn định: các dữ liệu đa phương tiện có khuynh hướng phi cấu trúc, vì vậy các tác nghiệp quản trị dữ liệu chuẩn như: chỉ số hóa, tìm kiếm nội dung, truy vấn dữ liệu thường là không áp dụng được hoặc rất khó áp dụng

2 Nội dung mang tính tạm thời: các dữ liệu liên tục như: ảnh động, video,

âm thanh và Hoạt hình đều phụ thuộc vào thời gian nên việc lưu trữ, thao tác và mô tả chúng là rất khó khăn và gắn liền với tính thời sự

3 Có dung lượng lớn: các dữ liệu đa phương tiện thường có dung lượng rất lớn, điều này đỏi hỏi nhiều không gian lưu trữ, tốc độ truy cập nhanh, hiệu quả

4 Các ứng dụng yêu cầu hỗ trợ: các dữ liệu phi chuẩn có thể đòi hỏi các quy trình xử lí phức tạp, lại có dung lượng lớn nên các ứng dụng khai thác thường đòi hỏi các yêu cầu hộ trợ chặt chẽ, chẳng hạn việc sử dụng các thuật toán nén dữ liệu hiệu quả là yêu cầu của các ứng dụng khai thác

dữ liệu đa phương tiện

1.1.2 Chỉ số hóa dữ liệu

1.1.2.1 Truy xuất và chỉ số hoá đa phương tiện

Các DBMS truy xuất các khoản mục dựa trên số liệu có cấu trúc khi sử dụng kết nối chính xác IR cũng được gọi là truy xuất dựa trên văn bản Việc truy xuất dựa vào nội dung đề cập đến việc truy xuất dựa trên những nét đặc trưng truyền thống hiện nay như màu sắc, hình thù thay cho lời giải thích văn bản về khoản mục truyền thông đó

Trang 16

Việc truy xuất dựa trên nội dung là chuẩn dựa trên sự đồng dạng thay vì một kết nối chính xác giữa một truy vấn và một tập các khoản mục dữ liệu MIRS đề cập đến một hệ thống cơ sở cung cấp việc truy xuất thông tin đa phương tiện khi sử dụng một

tổ hợp DBMS, IR và các kỹ thuật truy xuất dựa trên nội dung Trong một MIRS, một vài vấn đề như phiên bản và điều khiển an toàn có thể không thực hiện được đầy đủ Một MIRS đủ bản lĩnh ra đời được gọi là MDBMS

1.1.2.2 Trích rút đặc trưng, biểu diễn nội dung và chỉ số hoá

Trong các MIRS, một trong những vấn đề quan trọng nhất là trích rút đặc trưng hoặc biểu diễn nộ i dung (cái gì là những nét đặc trưng hoặc nội dung chính trong một khoản mục đa phương tiện) Trích rút đặc trưng có thể là quá trình tự động hay bán tự động

Trong một vài tài liệu truy xuất dựa vào nội dung, trích rút đặc trưng cũng được gọi là chỉ số hoá Sau đây, chúng ta theo quy ước chung Khi mà thuật ngữ “chỉ số” được sử dụng như một danh từ, điều đó có nghĩa là đề cập tới cấu trúc dữ liệu hoặc việc tổ chức những đặc trưng đã được trích rút để nghiên cứu có hiệu quả và truy xuất

1.2 Đặc trưng của dữ liệu hình ảnh

1.2.1 Giới thiệu

Trích rút đặc trưng là cơ sở cho phép tra cứu ảnh dựa vào nội dung Theo nghĩa rộng, các đặc trưng có thể bao gồm cả các đặc trưng dựa vào văn bản và các đặc trưng trực quan Các đặc trưng trực quan có thể được phân loại tiếp thành các đặc trưng chung và các đặc trưng trong các lĩnh vực cụ thể Các đặc trưng trực quan chung gồm: màu, kết cấu, và hình dạng ; các đặc trưng trong các lĩnh vực cụ thể là phụ thuộc ứng dụng, ví dụ: mặt người, vân tay Các đặc trưng lĩnh vực cụ thể bao gồm nhiều tri thức lĩnh vực

Nói chung, không tồn tại một biểu diễn đơn tốt nhất cho một đặc trưng đã cho,

và tùy vào điều kiện cụ thể nên lựa chọn một cách phù hợp các đặc trưng để mô tả ảnh

Trang 17

1.2.2 Đặc trưng và trích rút đặc trưng của ảnh số

Trích rút đặc trưng ảnh là cơ sở của CBIR Các đặc trưng theo nghĩa rộng có thể bao gồm cả đặc trưng dựa trên văn bản (từ khóa, chú thích) và các đặc trưng thị giác (màu sắc, kết cấu, hình dáng ) Trong phạm vi này các đặc trưng có thể tiếp tục được phân loại như các đặc trưng chung và đặc trưng cụ thể Các định dạng bao gồm màu sắc, kết cấu, và đặc trưng hình mà các ứng dụng sau này có thể ứng dụng, ví dụ khuôn mặt, vân tay Các đặc trưng chung là tốt hơn trong một số mô hình và có thể bao gồm kiến thức về nhiều lĩnh vực, ta không đề cập ở đây

1.2.2.1 Đặc trưng về màu sắc

Các đặc trưng màu được sử dụng nhiều nhất trong các đặc trưng tra cứu ảnh Nó tương đối mạnh mẽ để biến nền tảng và độc lập với kích thước hình ảnh và định hướng Trong tra cứu ảnh, biểu đồ màu là đặc trưng chung thường được dùng đại diện màu sắc Theo thống kê, nó biểu thị xác suất chung của các cường độ của ba kênh màu Swain và Ballard đề xuất biểu đồ màu giao, là biện pháp tương tự cho các biểu đồ màu sắc Hơn nữa, hầu hết các biểu đồ màu là rất thưa, gây lãng phí bộ nhớ và giảm độ chính xác khi thực hiện tra cứu ảnh, do đó Stricker và Orengo đề xuất sử dụng các biểu

đồ màu tích lũy thay vì sử dụng các biểu đồ màu thông thường

Bên cạnh các biểu đồ màu, nhiều đặc trưng màu khác được áp dụng trong truy xuất hình ảnh, bao gồm các khoảng màu và bộ màu Để khắc phục các hiệu ứng lượng

tử, như trong biểu đồ màu, Stricker và Orengo đề xuất sử dụng phương pháp mô-men khoảng màu Cơ sở toán học của phương pháp này là sự phân bổ bất kỳ màu sắc có thể được đặc trưng bởi những khoảng của nó Khoảng cách Euclide được sử dụng để tính toán các màu tương tự

Để tạo điều kiện tìm kiếm nhanh qua các bộ sưu tập ảnh quy mô lớn, Smith và Chang đề xuất thiết lập bộ màu như là một xấp xỉ với biểu đồ màu Đầu tiên họ chuyển đổi không gian màu (R, G, B) vào một miền không gian thống nhất, chẳng hạn như HSV, và sau đó lượng tử không gian màu sắc biến đổi thành các thùng M (M bins) Thiết lập màu được định nghĩa là sự lựa chọn các màu từ không gian màu lượng tử

Trang 18

Bởi vì việc thiết lập các đặc trưng Vectorsrs màu là trong hệ nhị phân, một cây tìm kiếm nhị phân được xây dựng để tìm kiếm nhanh

Hình 1.2 Màu RGB

Màu là đặc trưng trực quan quan trọng đầu tiên và đơn giản nhất cho đánh chỉ

số và tra cứu các ảnh Nó cũng là đặc trưng được sử dụng phổ biến nhất trong lĩnh vực này Một ảnh màu tiêu biểu được thu từ một camera số, hoặc được tải xuống từ Internet thường có ba kênh màu (các ảnh xám chỉ có một kênh, các ảnh đa phổ có thể có nhiều hơn ba kênh) Tuy nhiên, các giá trị của dữ liệu ba chiều từ ảnh màu không cho chúng

ta một mô tả chính xác của màu trong ảnh, nhưng cho vị trí của các pixel này trong không gian màu Các pixel có các giá trị (1,1,1) sẽ xuất hiện khác nhau về màu trong các không gian màu khác nhau Vì thế mô tả đầy đủ của một ảnh màu tiêu biểu sẽ bao gồm thông tin không gian hai chiều cho biết nơi của pixel màu trong miền không gian màu, và dữ liệu màu ba chiều cho biết nơi của pixel màu trong không gian này

Ở đây không gian màu được giả thiết là cố định, thông tin không gian trong ảnh

bị bỏ qua, và thông tin màu trong một ảnh tiêu biểu có thể được xem như tín hiệu ba chiều đơn

Các tín hiệu màu một hoặc hai chiều cũng được sử dụng rộng rãi trong CBIR, đặc biệt trong các ứng dụng mà các điều kiện thu ảnh tương phản mạnh là quan trọng Thông tin màu ở dạng các tọa độ xy hoặc ab của các hệ thống CIE XYZ và CIE LAB

có thể được sử dụng trong các ứng dụng độc lập cường độ Thông tin màu (Hue) được

sử dụng trong các ứng dụng nơi chỉ sự khác biệt giữa chất liệu của các đối tượng trong

Trang 19

cảnh là quan trọng Màu là bất biến dưới ánh sáng và thay đổi hình học của người quan sát và các góc chiếu sáng

Nếu coi thông tin màu của một ảnh như một tín hiệu một, hai, hoặc ba chiều, phân tích tín hiệu bằng việc sử dụng ước lượng mật độ xác suất là cách đơn giản nhất

để mô tả thông tin màu của ảnh Lược đồ là công cụ đơn giản nhất Các cách mô tả thông tin màu khác trong CBIR gồm sử dụng véc tơ gắn kết màu, tương quan màu, các màu trội, hoặc các dấu hiệu màu, và các momen màu

Do mọi pixel trong ảnh có thể được mô tả bởi ba thành phần màu trong một không gian màu nào đó, chẳng hạn các thành phần đỏ, xanh lam và xanh lơ trong không gian RGB, hoặc màu, độ sắc nét và cường độ trong không gian HSV; một lược

đồ (phân bố của số các pixel cho mỗi bin được lượng hoá) có thể được định nghĩa cho mỗi thành phần Rõ ràng, một lược đồ màu chứa nhiều bin hơn, nó có khả năng phân biệt tốt hơn Tuy nhiên, một lược đồ với một số lượng lớn các bin sẽ không chỉ tăng chi phí tính toán, mà cũng sẽ không thích hợp để xây dựng các chỉ số hiệu quả cho các cơ

sở dữ liệu ảnh

Hơn nữa, số lượng bin tốt không cải tiến hiệu năng tra cứu trong nhiều ứng dụng Một cách để giảm số các bin là sử dụng không gian màu đối lập cho phép độ chói của lược đồ được lấy mẫu xuống Một cách khác là sử dụng các phương pháp phân cụm để xác định K màu tốt nhất trong một không gian đã cho với tập các ảnh đã cho Mỗi màu tốt nhất này sẽ được chấp nhận như một bin lược đồ Do quá trình phân cụm lấy phân bố màu của các ảnh trên toàn bộ cơ sở dữ liệu ảnh vào xem xét, rất ít khả

Trang 20

năng các bin lược đồ trong đó không có hoặc có rất ít pixel Một lựa chọn khác là sử dụng các bin có số pixel lớn nhất do một số nhỏ các bin lược đồ thu được phần lớn các pixel của một ảnh Một sự giảm như thế không làm giảm hiệu năng của đối sánh lược

đồ, mà còn có thể tăng cường nó do các bin lược đồ nhỏ coi như là nhiễu

Khi một cơ sở dữ liệu ảnh chứa một số lượng lớn các ảnh, so sánh theo lược đồ

sẽ bão hòa sự phân biệt Để giải quyết vấn đề này người ta sử dụng kỹ thuật lược đồ liên kết Ngoài ra, lược đồ màu không đưa thông tin không gian của các pixel vào xem xét, vì thế các ảnh rất khác nhau có thể có các phân bố màu giống nhau Vấn đề này trở nên đặc biệt sâu sắc với các cơ sở dữ liệu lớn Để tăng khả năng phân biệt, một số cải tiến đã được đề xuất để liên kết thông tin không gian Một cách đơn giản là chia một ảnh thành các vùng con và tính lược đồ cho mỗi vùng con này Một trong các cách chia đơn giản là phân họach hình chữ nhật, hoặc phân đoạn vùng, thậm chí phân họach đối tượng Tăng số các vùng con sẽ tăng thông tin về vị trí, nhưng cũng tăng về chi phí bộ nhớ và thời gian tính toán

1.2.2.3 Véc tơ gắn kết màu

Các Vectorsrs gắn kết màu (CCV) đề xuất mỗi bin lược đồ được phân thành hai loại là gắn kết (nếu nó thuộc về một vùng màu đồng nhất lớn), hoặc không gắn kết (nếu

pixel gắn kết và không gắn kết trong bin màu thứ i của một ảnh thì CCV của một ảnh

nó đã được chỉ ra rằng CCV cung cấp các kết quả tra cứu tốt hơn lược đồ màu, đặc biệt cho các ảnh hoặc có phần lớn màu đồng nhất hoặc có phần lớn các vùng kết cấu Ngoài

ra, với biểu diễn lược đồ và Vectorsrs gắn kết màu, không gian màu HSV cung cấp các

u*v* và CIE L*a*b*

Trang 21

1.2.2.4 Tương quan màu

Tương quan màu được đề xuất không chỉ để mô tả các phân bố màu của các pixel, mà còn tương quan không gian của các cặp màu Chiều thứ nhất và thứ hai của lược đồ màu ba chiều là các màu của mọi cặp pixel và chiều thứ ba là khoảng cách không gian của chúng Một tương quan màu là một bảng được đánh chỉ số bởi các cặp màu, ở đây mục thứ k cho (i,j) chỉ rõ xác suất tìm được một pixel có màu j tại một khoảng cách k từ một pixel có màu i trong ảnh Cho I biểu diễn toàn bộ tập các pixel

bằng:

, ,

2 ) 1

k j i

i c

gọi là tự tương quan màu thường được sử dụng thay thế Tự tương quan màu chỉ thu tương quan không gian giữa các màu thuần nhất và vì thế giảm số chiều xuống còn O(Nd)

Hình 1.3 Lược đồ màu CIE 1976

So sánh với lược đồ màu và véc tơ gắn kết màu, tự tương quan màu cho các kết quả tra cứu tốt hơn, nhưng cũng cho chi phí tính toán cao hơn do nó có chiều cao

Trang 22

Ký hiệu mô tả đặc trƣng lƣợc đồ màu trội F đƣợc định nghĩa là một tập các cặp sau:

Về mặt toán học, ba momen đầu tiên đƣợc định nghĩa bằng:

) 3 1 ( f

N

1 j ij

) 4 1 ( )

) f

( N

1

1 2 i ij

) 5 1 ( )

) f

( N

1 (

1 N

1 j

3 i ij

Trang 23

Do chỉ 9 số (ba momen cho mỗi một trong ba thành phần màu) được sử dụng để biểu diễn nội dung màu của mỗi ảnh, các momen màu là một biểu diễn rất nén so với các đặc trưng màu khác Do biểu diễn rất nén này, nó có thể cũng giảm khả năng phân biệt Thông thường, các momen màu có thể được sử dụng như sơ duyệt lần đầu để giảm không gian tìm kiếm trước khi các đặc trưng màu phức tạp khác được sử dụng cho tra cứu

1.2.3 Thông tin không gian

Các vùng hoặc đối tượng với các đặc tính màu và kết cấu tương tự có thể được phân biệt dễ dàng bằng việc tận dụng các ràng buộc không gian Thí dụ, các vùng bầu trời màu xanh và biển xanh có thể có các lược đồ màu tương tự, nhưng các vị trí không gian của chúng trong các ảnh là khác nhau Do đó, vị trí không gian của các vùng (hoặc các đối tượng) hoặc quan hệ không gian giữa nhiều vùng (hoặc đối tượng) trong một ảnh thì rất hữu ích cho tìm kiếm các ảnh

Thu thông tin không gian của các đối tượng trong một ảnh là một quá trình quan trọng đối với các hệ thống GIS Quá trình này bao gồm việc biểu diễn vị trí không gian tuyệt đối và cũng bao gồm vị trí không gian tương đối của các đối tượng Các thao tác như giao và chồng được sử dụng Bố cục màu kết hợp thông tin không gian với thông tin màu xuất hiện trong ảnh và tạo ra một đặc trưng rất quan trọng trong quá trình tra cứu, gọi là đặc trưng màu – không gian

Trang 24

Biểu diễn quan hệ không gian được sử dụng rộng rãi nhất là các xâu 2D được

đề xuất bởi Chang và cộng sự Nó được xây dựng bởi việc chiếu các ảnh dọc theo các

trong V biểu diễn một đối tượng trong ảnh Mỗi ký hiệu trong A biểu diễn một loại

đối tượng dọc theo hình hộp tối thiểu của nó và mở rộng các quan hệ không gian thành hai tập toán tử không gian Một tập định nghĩa các quan hệ không gian cục bộ Tập còn lại định nghĩa quan hệ không gian toàn cục, chỉ ra rằng hình chiếu của hai đối tượng là

vị trí cho bắt đầu và kết thúc đường bao của đối tượng Tất cả các phương pháp này có thể hỗ trợ ba loại truy vấn Loại truy vấn 0 tìm tất cả các ảnh chứa đối tượng

n

2

chúng, nhưng khoảng cách giữa chúng là không đáng kể Loại 2 tìm tất cả các ảnh có quan hệ khoảng cách nào đó với mỗi ảnh khác

cho biểu diễn thông tin không gian Tuy nhiên, tìm kiếm các ảnh dựa trên các quan hệ không gian của các vùng còn lại một vấn đề nghiên cứu khó trong tra cứu ảnh dựa vào nội dung, do phân đoạn tin cậy của các đối tượng hoặc các vùng thường là không khả thi ngoại trừ các ứng dụng rất giới hạn Mặc dù một số hệ thống chia các ảnh thành các khối đều, chỉ thu được sự thành công khiêm tốn với các lược đồ chia không gian như thế do hầu hết các ảnh tự nhiên không thể ép thành các khối con đều về không gian Để giải quyết vấn đề này, một phương pháp dựa vào biến đổi radon, tận dụng phân bố không gian của các đặc trưng trực quan không cần phân đoạn phức tạp được đề xuất trong

1.2.4 Các đặc trưng mức cao

Phần lớn nghiên cứu tra cứu ảnh dựa vào nội dung hiện tại được tập trung vào các phương pháp tra cứu ảnh mức thấp Tuy nhiên, một số nhà nghiên cứu đã cố gắng

Trang 25

để lấp khoảng trống giữa tra cứu mức thấp và mức cao Họ có khuynh hướng tập trung vào một trong hai vấn đề Vấn đề thứ nhất là nhận biết cảnh Nó thường là quan trọng

để nhận biết toàn bộ loại cảnh được mô tả bằng một ảnh, vì có điều này trong bộ lọc quan trọng có thể được sử dụng khi tìm kiếm, và vì có điều này có thể giúp xác định một đối tượng cụ thể có xuất hiện hay không Hệ thống loại này là IRIS, nó sử dụng màu, kết cấu, vùng và thông tin không gian để thu lại sự giải thích về cảnh có khả năng nhất, sinh ra các ký hiệu mô tả văn bản có thể được nhập vào đối với bất kỳ hệ thống tra cứu dựa vào văn bản Các nhà nghiên cứu khác đã nhận biết các kỹ thuật đơn giản hơn cho phân tích cảnh, sử dụng các thành phần ảnh tần số thấp để huấn luyện mạng neural, hoặc thông tin màu lân cận được trích rút từ các ảnh độ phân giải thấp để xây dựng các khuôn mẫu được định nghĩa bởi người sử dụng

Vấn đề tập trung thứ hai của các Hoạt động nghiên cứu là nhận dạng đối tượng, một lĩnh vực quan tâm đối với cộng đồng thị giác máy tính trong nhiều năm Giờ đây các kỹ thuật được phát triển cho nhận dạng và phân loại các đối tượng với tra cứu cơ sở

dữ liệu theo suy nghĩ Nghiên cứu tốt nhất trong lĩnh vực này là của, tác giả đã lôi cuốn bởi sự phát triển một kỹ thuật cho nhận dạng người trong các ảnh, mặc dù cách tiếp cận của ông đã được áp dụng đối với một phạm vi rộng các đối tượng, bao gồm ngựa và cây Tất cả các kỹ thuật này được dựa trên ý tưởng của sự phát triển một mô hình của mỗi dạng để nhận dạng, nhận biết các vùng ảnh có thể chứa các mẫu đối tượng, và xây dựng bằng chứng để xác thực hay loại bỏ sự hiện diện của đối tượng

1.3 Các nghiên cứu và ứng dụng liên quan đến cơ sở dữ liệu ảnh

Hai trường hợp nghiên cứu và ứng dụng liên quan đến ảnh, được nhiều người đề cập trong những năm qua tại Việt Nam Những nghiên cứu và ứng dụng này cần đến :

Trang 26

1.3.1 Ảnh trong GIS

Hệ thống thông tin địa lý GIS đƣợc hình thành vào những năm 1960 và phát triển rất rộng rãi trong 10 năm lại đây GIS ngày nay là công cụ trợ giúp quyết định trong nhiều Hoạt động kinh tế - xã hội, quốc phòng của nhiều quốc gia trên thế giới GIS có khả năng trợ giúp các cơ quan chính phủ, các nhà quản lý, các doanh nghiệp, các cá nhân đánh giá đƣợc hiện trạng của các quá trình, các thực thể tự nhiên, kinh tế

- xã hội thông qua các chức năng thu thập, quản lý, truy vấn, phân tích và tích hợp các thông tin đƣợc gắn với một nền hình học (bản đồ) nhất quán trên cơ sở tọa độ của các

dữ liệu đầu vào

Viện Công nghệ thông tin, Viện khoa học và công nghệ Việt Nam cúng có các kết quả liên quan đến hệ thống thông tin địa lí

Trang 27

khiến cho GIS có phạm vi ứng dụng rộng trong nhiều lĩnh vực khác nhau (phân tích các sự kiện, dự đoán tác động và họach định chiến lược)

1.3.2 Đồ họa máy tính

Nhiều cấp học về công nghệ thông tin ở Việt Nam đưa môn xử lí ảnh vào chương trình đào tạo và huấn luyện Một số trung tâm sử dụng ảnh trong các dữ liệu đa phương tiện, trong khóa đào tạo về kĩ xảo điện ảnh, đồ họa máy tính…

Theo wikipedia, Đồ họa chuyển động là những hình ảnh đồ họa sử dụng cảnh quay video, hình động để tạo ra ảo giác về chuyển động hoặc xuất hiện động Đồ họa chuyển động thường kết hợp với âm thanh sử dụng trong các dự án đa phương tiện Đồ họa chuyển động được hiển thị qua các phương tiện truyền thông điện tử, tuy nhiên cũng có thể hiển thị qua các công nghệ khác

Ví dụ như Adobe Flash sử dụng kỹ thuật Tween máy tính cũng như kỹ thuật chuyển động frame by frame và video

Trang 28

Kể từ khi khái niệm Đồ họa chuyển động thì hình thức này vẫn chưa được phân loại rõ ràng trong các hình thức nghệ thuật Vào những năm 1800 mới bắt đầu có những bài thuyết trình đề nghị phân loại riêng Đồ họa chuyển động Đồ họa chuyển động phát triển bắt nguồn từ việc sử dụng máy tính để chỉnh sửa những đoạn phim, có

lẽ để bắt kịp với công nghệ máy tính lúc bấy giờ Trước khi máy tính là một phần không thể thiếu, thì đồ họa chuyển động đỏi hỏi rất nhiều thời gian và công sức, và cả hạn chế về ngân sách sản xuất

1.3.3 Bản quyền về hình ảnh

1.3.3.1 Hình ảnh nhân vật

Việc công bố có thể bị giới hạn bởi quyền cá nhân của người được chụp Mỗi một con người về nguyên tắc đều có quyền tự quyết định là hình ảnh về mình nói chung có được phép công bố hay không và trong phạm vi nào

Tuy nhiên, cá nhân đang ở trong các buổi hội họp công cộng (thí dụ như biểu tình, lễ hội) hay tình cờ đứng trong quang cảnh được phép có thể được nhìn thấy trong các hình ảnh tương ứng mà không cần phải có sự đồng ý của họ Thế nhưng những người có liên quan này không được phép là mục đích của tấm ảnh Theo đó thì được phép chụp hình một nhóm đông những người hâm mộ bóng đá trên khán đài nhưng không được phép lấy một người hâm mộ bóng đá riêng lẻ ra mà không có sự đồng ý của người đó để chụp một tấm hình chân dung Ngoài ra luật pháp đã quy định là không được phép làm tổn hại đến các lợi ích chính đáng của người được chụp hình thông qua những hình ảnh được phép như vậy

Nhân vật nổi tiếng (nhân vật tuyệt đối của lịch sử đương đại, thí dụ như chính trị gia nổi tiếng) và nhân vật "đứng trong ánh sáng của công chúng" một thời gian ngắn (nhân vật tương đối của lịch sử đương đại, thí dụ như một người vừa mới cứu người khác khỏi chết đuối) có thể được ghi hình và truyền bá lại mà không cần có sự đồng ý của họ Tuy vậy cũng có nhiều ý kiến cho rằng chỉ được phép khi các nhân vật trên hình ảnh đó thật sự là đang có một chức vụ công cộng

Trang 29

Theo luật Đức thì ngoài ra cũng không được phép nhìn trộm qua tường hay vượt qua các chướng ngại vật khác hay sử dụng những phương tiện giúp đỡ như ống kính chụp ảnh từ xa, thang hay cả máy bay để xâm phạm vào phạm vi riêng tư được bảo vệ của một nhân vật (nổi tiếng)

1.3.3.2 Tác phẩm nơi công cộng

Hình ảnh chụp những tác phẩm như tượng đài hay kiến trúc hiện đại hiện diện lâu dài trên đường phố và quảng trường công cộng đều có thể được phép công bố không cần phải lo ngại Nếu tác phẩm được bảo hộ về tác quyền được công bố trong không gian công cộng thì nên chú ý đến việc ghi chú nguồn gốc và một số giới hạn

nhất định của quyền được sửa chửa (Cho đến nay trong Wikipedia tiếng Đức có sự

đồng thuận là việc này không phải là một điều trở ngại cho việc đăng tải những hình ảnh này.) Điều này không có giá trị cho những tác phẩm nghệ thuật chỉ được công bố

(triển lãm) trong một thời gian ngắn nhất định trong công cộng

1.3.3.3 Công trình xây dựng

Việc công bố hình ảnh về các công trình xây dựng ở Đức (cũng như ở Áo và

Thụy Sĩ) nói chung là được bảo hộ bởi quyền tự do chụp toàn cảnh (Panoramafreiheit)

nhưng giới hạn nhìn từ bên ngoài Thêm vào đó là phải có thể đi đến điểm đứng để chụp hình mà không cần dùng phương tiện giúp đỡ Theo đó một cái thang, ngay khi chỉ được dùng chỉ để nhìn qua một chướng ngại vật, cũng không được phép như là một chiếc máy bay trực thăng Việc chụp từ một căn nhà khác cũng không được phép ngay

cả khi có phép đi vào điểm đứng để chụp hình

Hình 1.6 Một số ảnh lựa chọn

Trang 30

1.3.3.4 Vật thể trong không gian kín

Hiện đang có nhiều ý kiến khác nhau về tình trạng luật lệ cho những vật ở trong một phòng kín, thí dụ như trong viện bảo tàng hay trong một nhà trưng bày Đặc biệt là khi người "chủ nhà" cấm không cho chụp hình trong các phòng này hay chỉ cho phép dưới những giới hạn nhất định

Cũng không được phép công bố những hình ảnh mà trong đó có thể nhìn thấy những tác phẩm nghệ thuật vẫn còn được bảo hộ về quyền tác giả Các quyền này hết hạn 70 năm sau khi nhà nghệ thuật qua đời

Nếu tác phẩm được bảo hộ về tác quyền là một hình tượng khôi hài thì tất cả các

các sao chép và gia công tiếp theo (thí dụ như hàng merchandising) mà có thể nhận ra

hình tượng này trên đấy đều được bảo hộ về tác quyền và không thể đăng tải tại đây được Nếu chụp một chồng bìa đĩa hát mà bìa đầu tiên có thể được nhận thấy rõ thì đấy không phải là "hình tượng phụ" vì người nhiếp ảnh có ý định muốn cho thấy rõ bìa đầu tiên Tức là không thể tưởng tượng là không có trên hình Thế nhưng nếu hình tượng khôi hài này được gắn tại trụ sở của doanh nghiệp và có thể chụp được từ khu vực đường giao thông công cộng thì "tự do toàn cảnh" có hiệu lực

1.3.3.6 Biểu trưng

Biểu trưng không được hoan ngênh trên Commons vì thế mà nên truyền chúng lên Wikipedia tiếng Việt Chỉ có những hình dáng rất đơn giản không đạt được đến độ cao sáng tạo cần thiết hay là các biểu trưng trên các bảng được gắn cố định trong quang cảnh đường phố là được xem xét đến

Trang 31

1.3.3.7 Ảnh chụp màn hình

Việc sử dụng ảnh chụp màn hình để minh họa phần mềm cũng được tranh cãi

Từ những thảo luận về quyền hình ảnh có thể rút ra là các ảnh chụp màn hình tại Wikipedia không được bảo vệ bởi quyền trích dẫn và vì thế về cơ bản là không được phép Điều này cũng có giá trị cho các ảnh chụp màn hình từ các ghi hình truyền hình Chương trình thời sự trong truyền hình được phép tường thuật về Wikipedia với biểu trưng của Wikipedia nhưng Wikipedia không được phép làm một ảnh chụp màn hình

về tường thuật này vì các đài truyền hình có yêu cầu về việc bảo hộ quyền tác giả cho ngay cả các hình ảnh (không di động) từ chương trình của họ Các ngoại lệ là các ảnh chụp màn hình mà đã được người sở hữu tác quyền của chương trình phần mềm, trò chơi hay chương trình truyền hình đưa vào GFDL hay phạm vi công cộng

1.3.3.8 Sử dụng hình của người khác

Hình ảnh của người khác chỉ được phép truyền lên khi chúng không được bảo

hộ về tác quyền (hay có một giấy phép thích hợp) Trong đó cần phân biệt giữa những hình ảnh nói chung là không có khả năng được bảo hộ và những hình ảnh đã mất sự bảo hộ của pháp luật Thí dụ như một tấm ảnh thuộc về công cộng được xuất bản trong một quyển sách mà không được sửa chữa thì tấm ảnh này tất nhiên là có thể được sao chép lại tùy ý mà không cần có sự đồng ý của nhà xuất bản

1.3.3.9 Hình ảnh của tác giả vô danh

Điều cần phải chú ý là ngay cả khi không biết tác giả là ai hay không thể tìm ra tác giả với một công sức hợp lí thì vẫn có thể còn yêu cầu của những người kế thừa quyền theo pháp luật đối với những người sử dụng hình ảnh trong vòng 70 năm của thời hạn bảo hộ

Đối với những tác phẩm vô danh, điều 66 Luật quyền tác giả (Đức) quy định là

70 năm sau lần công bố đầu tiên quyền tác giả không còn nữa (hoặc là sau khi ra đời nếu như tác phẩm đã không được công bố 70 năm) Theo luật cũ nhưng vẫn tiếp tục có hiệu lực là đối với những hình ảnh ra đời trước ngày 1 tháng 7 năm 1995 thời hạn bảo

Trang 32

hộ vẫn là 70 năm sau khi tác giả qua đời (post mortem auctoris) nếu như trong một thời

điểm nào đó tác giả cho biết danh tính của mình cho tấm ảnh Chứng minh là trường hợp này không xảy ra thì trên thực tế là không thể vì có thể rằng ở một lúc nào đó tác giả đã công bố tên mình, tên một tấm hình hay ở trên một công bố ở đâu đấy

1.4 Kết luận

Chương 1 đã trình bày một số khái niệm liên quan đến dữ liệu ảnh, trong cơ sở

dữ liệu đa phương tiện Một số đặc trưng của màu sắc, hệ thống màu sắc là phương tiện

để rút các đặc trưng của dữ liệu ảnh, cho phép chỉ số hóa và tìm kiếm dữ liệu ảnh theo nội dung Vai trò của dữ liệu ảnh nói riêng, dữ liệu đa phương tiện nói chung có ý nghĩa đối với tổ chức cơ sở dữ liệu ảnh đề cập trong chương sau

Một số nghiên cứu và ứng dụng liên quan đến dữ liệu ảnh được nêu ra, với ý thể hiện tính khả thi của tổ chức cơ sở dữ liệu ảnh đối với qui mô ứng dụng công nghệ thông tin vừa và nhỏ

Việc bảo đảm bản quyền về tác phẩm đa phương tiện nói chung và hình ảnh nói riêng rất cần thiết Nó tạo điều kiện phát triển cho người sáng tác và tạo hưng phấn cho các ý tưởng sáng tác

Trang 33

Chương 2 TỔ CHỨC CƠ SỞ DỮ LIỆU ẢNH

2.1 Mô hình dữ liệu

2.1.1 Nhu cầu về mô hình dữ liệu

Người ta đã xác định mô hình dữ liệu là tập các mô tả và qui luật mô tả dữ liệu Trong DBMS, mô hình dữ liệu có vai trò cung cấp khung, hay ngôn ngữ, diễn tả các tính chất của mục tin được lưu trữ và tìm kiếm trong hệ thống Khung này cho phép người thiết kế và người dung xác định, thêm, bớt, sửa và tìm kiếm các mục cơ sở dữ liệu và tính chất của chúng Trong MIRS và hệ thống đa phương tiện, mô hình dữ liệu giả sử vai trò bổ sung là mô tả, tính toán các mức trừu tượng khác nhau từ dữ liệu đa phương tiện

Các mô hình dữ liệu đa phương tiện nắm bắt các tính chất tĩnh và động của các mục cơ sở dữ liệu, vậy nên cung cấp cơ sở hình thức để phát triển các công cụ phù hợp dùng với dữ liệu đa phương tiện Các tinh chất tĩnh gồm các đối tượng tạo nên dữ liệu

đa phương tiện, mối liên hệ giữa các đối tượng, thuộc tính đối tượng các tính chất động gồm tính chất liên quan đến tương tác giữa các đối tượng, phép toán trên các đối tượng, tương tác người dùng Sự phong phú của mô hình dữ liệu có vai trò tăng tính

sử dụng của MIRS Dù các kiểu dữ liệu đa phương tiện cơ bản đã có, nhưng đó chỉ cung cấp nền để xây dựng các đặc trưng

Không gian đặc trưng nhiều chiều là tính chất của chỉ số hóa đa phương tiện Một mô hình dữ liệu trợ giúp thể hiện không gian nhiều chiều, đặc biệt độ đo khoảng cách trong không gian đó Nhìn chung, mô hình dữ liệu MIRS cần đạt các yêu cầu sau:

1 Mô hình dữ liệu cần mở rộng được, để bổ sung kiểu dữ liệu mới

2 Mô hình dữ liệu cần thể hiện các kiểu phương tiện cơ bản và các đối tượng hỗn hợp với các quan hệ không gian và thời gian

Trang 34

3 Mô hình dữ liệu cần mềm dẻo để có thể mô tả, hỏi và tìm kiếm các mục theo các mức trừu tượng

4 Mô hình dữ liệu cho phép lữu trữ và tìm kiếm hiệu quả

Nhiều người cho rằng mô hình dữ liệu MIRS cần là mô hình hướng đối tượng

và phân cấp nhiều tầng Thiết kế OO đảm bảo đóng gói mã và dữ liệu vào cùng một đơn vị, gọi là đối tượng Mã này xác định các phép toán thực hiện trên dữ liệu Việc đóng gói làm tăng tính khối và che đi chi tiết về phương tiện cụ thể và việc xử lý Điều quan trọng hơn, tiếp cận OO cung cấp khả năng mở rộng do cơ thể tăng cường và mở rộng đối tượng đã có

Hình 2.1 Mô hình cơ sở dữ liệu đa phương tiện tổng quát

Ngày đăng: 31/07/2014, 01:40

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Đặng Văn Đức, Nguyễn Thị Phương Trà, Giao diện người-máy, Nxb. Nhà xuất bản Khoa học Tự nhiên và Công nghệ, 2009 Khác
[2]. Đỗ Năng Toàn, Giáo trình xử lí ảnh, Viện Tin học, 2010 Khác
[3]. Đỗ Trung Tuấn, Hệ thống đa phương tiện, Nxb. Đại học Quốc gia Hà Nội, 2011 [4]. Hoàng Đức Hải, Lập Trình Ứng Dụng Chuyên Nghiệp SQL Server 2000, Nxb.Lao động - Xã hội, 2010 Khác
[7]. Lê Thị Lan, Cơ sở dữ liệu đa phương tiện, cơ sở dữ liệu ảnh, Trung tâm MICA, Trường Đại học Bách khoa Hà Nội, 2011 Khác
[8]. Phạm Hữu Khang, Quản trị cơ sở dữ liệu SQL SERVER, Nxb. Thống kê, 2010 [9]. Vũ Đức Thi, Cơ sở dữ liệu, Nxb. Thống kê, 2004 Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.1 Dữ liệu đa phương tiện - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 1.1 Dữ liệu đa phương tiện (Trang 14)
Hình 1.3 Lược đồ màu CIE 1976 - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 1.3 Lược đồ màu CIE 1976 (Trang 21)
Hình 1.4 Các thành phần của GIS - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 1.4 Các thành phần của GIS (Trang 26)
Hình 1.5 Thiết kế đồ họa - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 1.5 Thiết kế đồ họa (Trang 27)
Hình ảnh chụp những tác phẩm nhƣ tƣợng đài hay kiến trúc hiện đại hiện diện  lâu  dài  trên  đường  phố  và  quảng  trường  công  cộng  đều  có  thể  được  phép  công  bố  không cần phải lo ngại - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
nh ảnh chụp những tác phẩm nhƣ tƣợng đài hay kiến trúc hiện đại hiện diện lâu dài trên đường phố và quảng trường công cộng đều có thể được phép công bố không cần phải lo ngại (Trang 29)
Hình 2.1 Mô hình cơ sở dữ liệu đa phương tiện tổng quát - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.1 Mô hình cơ sở dữ liệu đa phương tiện tổng quát (Trang 34)
Hình 2.2 Mô hình dữ liệu VIMSYS - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.2 Mô hình dữ liệu VIMSYS (Trang 36)
Hình 2.3 Mô hình dữ liệu video tổng quát - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.3 Mô hình dữ liệu video tổng quát (Trang 37)
Hình 2.4 Mô hình tìm kiếm thông tin tổng quát. - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.4 Mô hình tìm kiếm thông tin tổng quát (Trang 40)
Hình 2.5 Tìm kiếm theo nội dung, dựa vào từ khóa, trên mô hình chuyển trạng thái - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.5 Tìm kiếm theo nội dung, dựa vào từ khóa, trên mô hình chuyển trạng thái (Trang 41)
Hình 2.6 Tìm kiếm trong PICTION - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.6 Tìm kiếm trong PICTION (Trang 41)
Hình 2.7 Tìm kiếm trong QBIC - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.7 Tìm kiếm trong QBIC (Trang 42)
Hình 2.7 Hỏi theo nội dung với ngôn ngữ QBIC - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.7 Hỏi theo nội dung với ngôn ngữ QBIC (Trang 43)
Hình 2.8 Tìm kiếm trong CVQL - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.8 Tìm kiếm trong CVQL (Trang 43)
Hình 2.9 Hiển thị kết quả trong hệ thống VEVA - CÁC đặc TRƯNG ẢNH TRONG cơ sở dữ LIỆU ẢNH
Hình 2.9 Hiển thị kết quả trong hệ thống VEVA (Trang 44)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm