nên thường dẫn tới sự không chính xác; trong khi đó với phương pháp tra cứu ảnh dựa vào đặc trưng lại phụ thuộc vào cách mà người dùng rút trích đặc trưng, mà một ảnh số được cấu thành b
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
Phạm Văn Cường
CÁC ĐẶC TRƯNG HÌNH ẢNH TRONG
CƠ SỞ DỮ LIỆU ẢNH
LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH
Thái Nguyên, Năm 2011
Trang 2LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS ĐỖ TRUNG TUẤN
Thái Nguyên, năm 2011
Trang 3LỜI CẢM ƠN
Trước hết tôi xin được bày tỏ lòng cảm ơn sâu sắc và sự kính trọng của mình đến các thầy cô giáo Trường Đại học Công nghệ Thông tin và Truyền thông, Đại học Thái Nguyên, các thầy cô giáo Viện công nghệ thông tin thuộc Viện công nghệ Việt Nam đặc biệt là các thầy cô giáo đã giảng dạy và giúp đỡ tôi trong suốt quá trình học tập nâng cao sau đại học
Nhân dịp hoàn thành luận văn tốt nghiệp cao học của mình, tôi xin trân trọng cảm ơn thầy giáo PGS-TS Đỗ Trung Tuấn- Trường Đại học Khoa Học Tự Nhiên thuộc trường Đại học Quốc Gia Hà Nội đã nhiệt tình hướng dẫn để tôi hoàn thành luận văn này
Tôi xin cảm ơn bạn bè, đồng nghiệp tại Thanh Hóa, đã luôn động viên, giúp đỡ tôi trong quá trình học tập và công tác, để tôi học tập và hoàn thành luận văn này
Xin gửi đến người thân, gia đình tôi, những người đã tạo điều kiện và động viên, trợ giúp tôi về tinh thần, thông cảm và giúp đỡ tôi rất nhiều trong thời gian học tập này
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn khoa học của thầy giáo hướng dẫn Các số liệu, kết quả nêu trong luận văn là trung thực Những kết luận của luận văn chưa từng được ai công bố trong bất kỳ công trình nào khác
Thái Nguyên, ngày 01 tháng 10 năm 2011
Phạm Văn Cường
Trang 5Mục lục
LỜI CẢM ƠN i
LỜI CAM ĐOAN ii
Mục lục iii
Danh mục kí hiệu và viết tắt v
Danh mục hình và bảng vi
MỞ ĐẦU 1
Chương 1 VAI TRÒ CỦA DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ VIỆC TRÍCH CHỌN ĐẶC TRƯNG 4
1.1 Các dữ liệu đa phương tiện và số hóa dữ liệu 4
1.1.1 Các dữ liệu đa phương tiện 4
1.1.2 Chỉ số hóa dữ liệu 6
1.2 Đặc trưng của dữ liệu hình ảnh 7
1.2.1 Giới thiệu 7
1.2.2 Đặc trưng và trích rút đặc trưng của ảnh số 8
1.2.3 Thông tin không gian 14
1.2.4 Các đặc trưng mức cao 15
1.3 Các nghiên cứu và ứng dụng liên quan đến cơ sở dữ liệu ảnh 16
1.3.1 Ảnh trong GIS 17
1.3.2 Đồ họa máy tính 18
1.3.3 Bản quyền về hình ảnh 19
1.4 Kết luận 23
Chương 2 TỔ CHỨC CƠ SỞ DỮ LIỆU ẢNH 24
2.1 Mô hình dữ liệu 24
2.1.1 Nhu cầu về mô hình dữ liệu 24
2.1.2 Các mô hình thí dụ 27
2.2 Kĩ thuật chỉ số hóa 30
2.3 Kĩ thuật tìm kiếm 30
Trang 62.3.1 Một số hệ thống 32
2.3.2 Tìm các đối tượng dựa trên hình dạng và từ khóa 36
2.3.3 Thể hiện hình dạng 38
2.3.4 Việc khớp các hình 38
2.4 Kết luận 39
Chương 3 TỔ CHỨC LƯU TRỮ ẢNH PHONG CẢNH THANH HÓA 40
3.1 Mô tả bài toán 40
3.1.1 Giới thiệu về quê hương Thanh Hóa 40
3.1.2 Đặt bài toán 47
3.2 Phân tích đặc trưng và nhu cầu về chỉ số hóa hình ảnh theo đặc trưng 47
3.2.1 Các thuộc tính của ảnh phong cảnh 47
3.2.2 Các thông tin liên quan đến ảnh 47
3.3 Thiết kế cơ sở dữ liệu 48
3.3.1 Bảng dữ liệu về thể loại ảnh 48
3.3.2 Bảng dữ liệu về tác giả ảnh 48
3.3.3 Bảng dữ liệu về giấy ảnh 48
3.3.4 Bảng dữ liệu về bộ sưu tập 49
3.3.5 Bảng dữ liệu về mô tả ảnh 49
3.3.6 Lược đồ quan hệ cơ sở dữ liệu 50
3.4 Khai thác cơ sở dữ liệu ảnh phong cảnh Thanh Hóa 50
3.4.1 Hạ tầng kĩ thuật 52
3.4.2 Một số màn hình giao diện 52
3.5 Kết luận 56
KẾT LUẬN 57
Một số vấn đề đã giải quyết 57
Phương hướng tiếp tục nghiên cứu 58
TÀI LIỆU THAM KHẢO 59
Trang 7Danh mục kí hiệu và viết tắt
CBIR Content Based Image
CSDL Data Base Cơ sở dữ liệu
DBMS
GCH Global Color Histogram Lược đồ màu toàn cục
Các giá trị đánh giá màu sắc
IR Information Retrieve Hệ thống tìm kiếm thông tin
LCH Local Color Histogram Lược đồ màu cục bộ
MIRS Hệ thống tìm kiếm thông tin đa
phương tiện PCA Principal component analysis Phân tích thành phần chính
QBIC Query By Image Content Truy vấn theo nội dung ảnh
RGB Red Green Blue Đỏ Xanh xanh dương
TBIR Text Based Image Retrieval Tra cứu ảnh dựa vào văn bản mô
tả TBIR Text Based Image Retrieval Tìm ảnh dựa theo văn bản
Visual SEEK
Trang 8Danh mục hình và bảng
Hình 1.1 Dữ liệu đa phương tiện 5
Hình 1.2 Màu RGB 9
Hình 1.3 Lược đồ màu CIE 1976 12
Hình 1.4 Các thành phần của GIS 17
Hình 1.5 Thiết kế đồ họa 18
Hình 1.6 Một số ảnh lựa chọn 20
Hình 2.1 Mô hình cơ sở dữ liệu đa phương tiện tổng quát 25
Hình 2.2 Mô hình dữ liệu VIMSYS 27
Hình 2.3 Mô hình dữ liệu video tổng quát 28
Hình 2.4 Mô hình tìm kiếm thông tin tổng quát 31
Hình 2.5 Tìm kiếm theo nội dung, dựa vào từ khóa, trên mô hình chuyển trạng thái 32
Hình 2.6 Tìm kiếm trong PICTION 32
Hình 2.7 Tìm kiếm trong QBIC 33
Hình 2.7 Hỏi theo nội dung với ngôn ngữ QBIC 34
Hình 2.8 Tìm kiếm trong CVQL 34
Hình 2.9 Hiển thị kết quả trong hệ thống VEVA 35
Hình 2.10 Thể hiện quĩ đạo 36
Hình 2.11 Một số bước xác định công việc trích đặc trưng ảnh 39
Hình 3.1 Bãi biển Hải Hoà, Tĩnh Gia 41
Hình 3.2 Vị trí tỉnh Thanh Hóa trên bản đồ đất nước 42
Hình 3.3 Tượng đài vua Lê Lợi 44
Hình 3.4 Suối cá Thanh Hóa 44
Bảng 3.1 Mô tả dữ liệu ảnh 48
Bảng 3.2 Mô tả dữ liệu liên quan đến nghệ sĩ nhiếp ảnh 48
Bảng 3.3 Dữ liệu về chất liệu ảnh 48
Bảng 3.4 Dữ liệu liên quan đến các bộ sưu tập ảnh, hình đồ họa 49
Bảng 3.5 Mô tả thông tin về ảnh, hình đồ họa 49
Trang 9Hình 3.5 Lược đồ quan hệ của cơ sở dữ liệu 50
Hình 3.6 Truy cập cơ sở dữ liệu ảnh 51
Hình 3.7 Hệ quản trị cơ sở dữ liệu và mạng 52
Hình 3.8 Form cập nhật danh mục giấy ảnh 52
Hình 3.9 Form cập nhật bộ sưu tập ảnh 53
Hình 3.10 Form cập nhật thông tin ảnh 54
Hình 3.11 Form tìm kiếm và kết xuất các file ảnh 55
Hình 3.12 Form duyệt và xem ảnh 55
Trang 10Mặt khác, với sự phát triển mạnh mẽ của công nghệ thông tin, đặc biệt là sự phát triển của mạng Internet làm cho số lượng ảnh số được lưu trữ và trao đổi qua Internet là rất lớn Do đó bài toán thực tế đặt ra là cần phải có phương pháp tổ chức cơ
sở dữ liệu ảnh phù hợp, cùng với việc tìm kiếm, tra cứu ảnh hiệu quả, có độ chính xác cao và có hiệu năng tốt
Việc tìm kiếm một bức ảnh thỏa mãn tiêu chí tìm kiếm trong vô số các bức ảnh thuộc đủ loại chủ đề và định dạng khác nhau là rất khó khăn, và khi số lượng ảnh trong một bộ cơ sở dữ liệu còn ít, việc nhận diện một bức ảnh hay việc so sánh sự giống và khác nhau giữa nhiều bức ảnh có thể thực hiện được bằng mắt thường, tuy nhiên khi số lượng ảnh rất lớn thì việc so sánh này rất khó khăn, và do đó cần có các phương pháp hiệu quả và phù hợp hơn
Trong thực tế, bài toán tra cứu ảnh số có rất nhiều ứng dụng quan trọng, ví dụ như bài toán „„Quản lý logo trong sở hữu trí tuệ‟‟, „„So sánh mẫu vân tay trong khoa học hình sự‟‟, „„Tìm kiếm danh lam thắng cảnh trong du lịch, địa lý‟‟, „„Xây dựng thư viện hình ảnh‟‟ Việc tìm ra các phương pháp tổ chức dữ liệu ảnh và cách thức tra cứu, tìm kiếm ảnh hiệu quả sẽ là điều kiện quan trọng để giải quyết các bài toán như trên Từ đó, việc tìm ra các phương pháp lưu trữ, cách thức tra cứu và xếp hạng các ảnh được lưu trên các thẻ nhớ hay trên các thiết bị lưu trữ là vấn đề có tính thiết thực và hiệu quả cao trong thực tiễn
Trang 11Với các định dạnh ảnh số khác nhau sẽ có các phương pháp tra cứu ảnh hiệu quả khác nhau Hiện nay có hai xu hướng chính trong việc tra cứu ảnh số là tra cứu ảnh theo văn bản mô tả ảnh TRIR và tra cứu ảnh theo đặc trưng ảnh CBIR Một số công cụ tra cứu ảnh theo văn bản mô tả ảnh như Yahoo, MSN, Google Image Search và một
số công cụ tra cứu ảnh theo nội dung như Tineye, Bing, Google Image Swirl, Tiltomo
Mỗi phương pháp tra cứu ảnh đều có điểm mạnh và hạn chế riêng, ví dụ tra cứu ảnh theo văn bản mô tả phụ thuộc vào các văn bản mô tả ảnh - điều này lại phụ thuộc vào chủ quan của người dùng, sự không chính xác trong các văn bản mô tả nên thường dẫn tới sự không chính xác; trong khi đó với phương pháp tra cứu ảnh dựa vào đặc trưng lại phụ thuộc vào cách mà người dùng rút trích đặc trưng, mà một ảnh số được cấu thành bởi nhiều đặc trưng khác nhau như màu sắc, không gian màu, vân ảnh, kết cấu ảnh, hình dạng ảnh Do đó để việc tra cứu ảnh được hiệu quả, người ta thường lồng ghép các phương pháp tra cứu khác nhau một cách linh Hoạt và phù hợp
Phương pháp tra cứu ảnh được nhiều người quan tâm nghiên cứu hiện nay là kỹ thuật „„Tra cứu ảnh dựa theo nội dung‟‟ Kỹ thuật này cho phép trích rút các đặc trưng của ảnh dựa vào nội dung trực quan của bản thân ảnh như màu sắc, kết cấu, hình dạng
và bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp, tổ chức cơ sở dữ liệu ảnh Việc biểu diễn và trích rút đặc trưng để nhận dạng được bức ảnh mong muốn
ấy rất quan trọng và nhiều hướng nghiên cứu khác nhau đó được triển khai Một số hệ thống tra cứu ảnh nổi tiếng như QBIC (IBM), Virage (Virage Inc.), Photobook (MIT), Visual SEEK (Columbia University) đã áp dụng kỹ thuật này
Tuy nhiên, khi cơ sở dữ liệu ảnh lớn thì việc tìm kiếm ảnh bằng cách so sánh ảnh truy vấn với mỗi ảnh trong cơ sở dữ liệu sẽ tốn rất nhiều thời gian và không thể áp dụng được đối với các cơ sở dữ liệu ảnh lớn Thực tế đòi hỏi thời gian tìm kiếm không được tăng tuyến tính đối với số các ảnh trong cơ sở dữ liệu Chính vì lí do đó tôi chọn
đề tài “Các đặc trưng hình ảnh trong cơ sở dữ liệu ảnh”
Trang 12Đề tài này nghiên cứu cơ sở lý thuyết và các ứng dụng chính của kỹ thuật tra cứu ảnh theo nội dung và kỹ thuật đánh chỉ số ảnh dựa vào phân cụm Trong kỹ thuật này, tại thời điểm truy vấn, ảnh truy vấn không so sánh với tất cả các ảnh trong cơ sở
dữ liệu, mà chỉ so sánh với một tập con rất nhỏ các ảnh Trên cơ sở đó thử nghiệm phương pháp cụ thể để xây dựng một chương trình phần mềm đọc vào một ảnh danh lam thắng cảnh mẫu và tìm kiếm những ảnh danh lam thắng cảnh tương tự với ảnh mẫu trong tập hợp các ảnh cho trước Kết quả thực hiện đề tài sẽ giúp cho việc tìm kiếm các ảnh danh lam thắng cảnh trong tập hợp các ảnh được nhanh hơn, đồng thời có thể làm
cơ sở cho việc xây dựng nên các hệ thống ứng dụng có tính thực tiễn cao phục vụ cho nhu cầu phát triển của xã hội và cho công tác nghiên cứu sau này
Sau phần mở đầu, nội dung của luận văn gồm 3 chương và phần kết luận:
đặc trưng” sẽ trình bày tổng quan về dữ liệu đa phương tiện và một số khía cạnh liên quan đến trích chọn nội dung
trình phân tích, thiết kế và cài đặt cơ sở dữ liệu ảnh
cảnh Thanh Hóa” thể hiện ứng dụng của việc tìm hiểu về cơ sở dữ liệu ảnh trong địa bàn công tác của học viên Các tư liệu ảnh của tỉnh Thanh Hóa được dùng làm dữ liệu cho cơ sở dữ liệu ảnh
Cuối cùng kết luận và danh sách các tài liệu tham khảo, sử dụng trong luận văn
Trang 13Chương 1 VAI TRÒ CỦA DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ
VIỆC TRÍCH CHỌN ĐẶC TRƯNG
Chương 1 trình bày một số khái niệm liên quan đến dữ liệu đa phương tiện và ý nghĩa của việc trích chọn đặc trưng
1.1 Các dữ liệu đa phương tiện và số hóa dữ liệu
1.1.1 Các dữ liệu đa phương tiện
1.1.1.1 Giới thiệu về dữ liệu đa phương tiện
Dữ liệu đa phương tiện bao gồm: văn bản, đồ họa, Hoạt hình, âm thanh, video,… Trong đó có văn bản, âm thanh, hình ảnh và ảnh động
1 Văn bản (Text): Trong các ứng dụng đa phương tiện, văn bản hiện được sử dụng rộng dãi Nguyên nhân là do việc thể hiện văn bản trên màn hình có kích thước và
độ phân giải nhỏ rất thuận lợi Đồng thời có nhiều thông tin không thể hiện được bằng các công cụ đa phương tiện khác, khi đó văn bản là hình thức được sử dụng để thể hiện thông tin đó
2 Âm thanh (Sound) được xem gồm âm nhạc, tiếng động, tiếng nói Âm thanh: hay
âm nhạc cũng như các bài phát biểu có sức mạnh về mặt tạo cảm xúc Âm nhạc có thể kích thích tâm trạng tích cực trong phục hồi hoặc thư giản trí tuệ và cơ thể, trong khi đó âm thanh như là tiếng ồn tác động đến con người Sự kết hợp âm thanh với hình ảnh động sẽ thể hiện thể giới trực quan Tiếng nói là một dữ liệu có tính liên tục, tiếng nói có thể được sử dụng giới thiệu, trình bày, nêu yêu cầu.… Tiếng nói được coi như là công cụ giải thích bổ sung hữu hiệu cho văn bản
trạng của người quan sát có thể quyết định nội dung của hình ảnh, khi đó sự kết hợp giữa hình ảnh và âm thanh sẽ cho kết quả đầy đủ về nội dung thực Đồ họa (Graphic): là một thành phần đa phương tiện rất mạnh được sử dụng để thể hiện
Trang 14ngữ cảnh Đồ họa là một kiểu dữ liệu độc lập, từ hình ảnh đồ họa có thể xác định được những khoảnh khắc (không gian) và thời gian Đồ họa là loại dữ liệu thích hợp cho việc nghiên cứu và phân tích các mối quan hệ Đồ họa có thể kết hợp với văn bản để mô tả đầy đủ về đối tượng Đồ họa thể hiện đối tượng chi tiết hơn so với hình ảnh và thể hiện tốt các đối tượng mang tính trừu tượng.
4 Hoạt hình (Animation): Hoạt hình cũng là một thành phần trong cơ sở dữ liệu đa phương tiện Hoạt hình có thể hiểu là các hình ảnh thay đổi, thể hiện sự thay đổi các thuộc tính của đối tượng trong một khoảng thời gian Hoạt hình đòi hỏi nhiều không gian bộ nhớ để lưu trữ hơn so với hình ảnh Video: là dữ liệu mạnh nhất của tất cả các loại dữ liệu đa phương tiện Nó có khả năng miêu tả đầy đủ về thể giới thực Nó giúp người xem hiểu và nhớ sâu sắc nội dung cần diễn đạt
Hình 1.1 Dữ liệu đa phương tiện
1.1.1.2 Phân loại dữ liệu đa phương tiện
Các dữ liệu đa phương tiện được chia thành hai lớp: lớp các dữ liệu không liên tục và lớp các dữ liệu liên tục
thuộc vào thời gian, các dữ liệu không liên tục gồm: dữ liệu văn bản không có cấu trúc hoặc có cấu trúc, các hình ảnh,…
Trang 15 Các dữ liệu liên tục là những dữ liệu nội dung trình bày phụ thuộc vào thời gian, các dữ liệu liên tục gồm: tiếng nói, âm thanh, video, Hoạt hình,…
1.1.1.3 Các đặc tính của dữ liệu đa phương tiện
Các đặc tính chung của dữ liệu đa phương tiện gồm:
1 Không có cấu trúc ổn định: các dữ liệu đa phương tiện có khuynh hướng phi cấu trúc, vì vậy các tác nghiệp quản trị dữ liệu chuẩn như: chỉ số hóa, tìm kiếm nội dung, truy vấn dữ liệu thường là không áp dụng được hoặc rất khó áp dụng
2 Nội dung mang tính tạm thời: các dữ liệu liên tục như: ảnh động, video,
âm thanh và Hoạt hình đều phụ thuộc vào thời gian nên việc lưu trữ, thao tác và mô tả chúng là rất khó khăn và gắn liền với tính thời sự
3 Có dung lượng lớn: các dữ liệu đa phương tiện thường có dung lượng rất lớn, điều này đỏi hỏi nhiều không gian lưu trữ, tốc độ truy cập nhanh, hiệu quả
4 Các ứng dụng yêu cầu hỗ trợ: các dữ liệu phi chuẩn có thể đòi hỏi các quy trình xử lí phức tạp, lại có dung lượng lớn nên các ứng dụng khai thác thường đòi hỏi các yêu cầu hộ trợ chặt chẽ, chẳng hạn việc sử dụng các thuật toán nén dữ liệu hiệu quả là yêu cầu của các ứng dụng khai thác
dữ liệu đa phương tiện
1.1.2 Chỉ số hóa dữ liệu
1.1.2.1 Truy xuất và chỉ số hoá đa phương tiện
Các DBMS truy xuất các khoản mục dựa trên số liệu có cấu trúc khi sử dụng kết nối chính xác IR cũng được gọi là truy xuất dựa trên văn bản Việc truy xuất dựa vào nội dung đề cập đến việc truy xuất dựa trên những nét đặc trưng truyền thống hiện nay như màu sắc, hình thù thay cho lời giải thích văn bản về khoản mục truyền thông đó
Trang 16Việc truy xuất dựa trên nội dung là chuẩn dựa trên sự đồng dạng thay vì một kết nối chính xác giữa một truy vấn và một tập các khoản mục dữ liệu MIRS đề cập đến một hệ thống cơ sở cung cấp việc truy xuất thông tin đa phương tiện khi sử dụng một
tổ hợp DBMS, IR và các kỹ thuật truy xuất dựa trên nội dung Trong một MIRS, một vài vấn đề như phiên bản và điều khiển an toàn có thể không thực hiện được đầy đủ Một MIRS đủ bản lĩnh ra đời được gọi là MDBMS
1.1.2.2 Trích rút đặc trưng, biểu diễn nội dung và chỉ số hoá
Trong các MIRS, một trong những vấn đề quan trọng nhất là trích rút đặc trưng hoặc biểu diễn nộ i dung (cái gì là những nét đặc trưng hoặc nội dung chính trong một khoản mục đa phương tiện) Trích rút đặc trưng có thể là quá trình tự động hay bán tự động
Trong một vài tài liệu truy xuất dựa vào nội dung, trích rút đặc trưng cũng được gọi là chỉ số hoá Sau đây, chúng ta theo quy ước chung Khi mà thuật ngữ “chỉ số” được sử dụng như một danh từ, điều đó có nghĩa là đề cập tới cấu trúc dữ liệu hoặc việc tổ chức những đặc trưng đã được trích rút để nghiên cứu có hiệu quả và truy xuất
1.2 Đặc trưng của dữ liệu hình ảnh
1.2.1 Giới thiệu
Trích rút đặc trưng là cơ sở cho phép tra cứu ảnh dựa vào nội dung Theo nghĩa rộng, các đặc trưng có thể bao gồm cả các đặc trưng dựa vào văn bản và các đặc trưng trực quan Các đặc trưng trực quan có thể được phân loại tiếp thành các đặc trưng chung và các đặc trưng trong các lĩnh vực cụ thể Các đặc trưng trực quan chung gồm: màu, kết cấu, và hình dạng ; các đặc trưng trong các lĩnh vực cụ thể là phụ thuộc ứng dụng, ví dụ: mặt người, vân tay Các đặc trưng lĩnh vực cụ thể bao gồm nhiều tri thức lĩnh vực
Nói chung, không tồn tại một biểu diễn đơn tốt nhất cho một đặc trưng đã cho,
và tùy vào điều kiện cụ thể nên lựa chọn một cách phù hợp các đặc trưng để mô tả ảnh
Trang 171.2.2 Đặc trưng và trích rút đặc trưng của ảnh số
Trích rút đặc trưng ảnh là cơ sở của CBIR Các đặc trưng theo nghĩa rộng có thể bao gồm cả đặc trưng dựa trên văn bản (từ khóa, chú thích) và các đặc trưng thị giác (màu sắc, kết cấu, hình dáng ) Trong phạm vi này các đặc trưng có thể tiếp tục được phân loại như các đặc trưng chung và đặc trưng cụ thể Các định dạng bao gồm màu sắc, kết cấu, và đặc trưng hình mà các ứng dụng sau này có thể ứng dụng, ví dụ khuôn mặt, vân tay Các đặc trưng chung là tốt hơn trong một số mô hình và có thể bao gồm kiến thức về nhiều lĩnh vực, ta không đề cập ở đây
1.2.2.1 Đặc trưng về màu sắc
Các đặc trưng màu được sử dụng nhiều nhất trong các đặc trưng tra cứu ảnh Nó tương đối mạnh mẽ để biến nền tảng và độc lập với kích thước hình ảnh và định hướng Trong tra cứu ảnh, biểu đồ màu là đặc trưng chung thường được dùng đại diện màu sắc Theo thống kê, nó biểu thị xác suất chung của các cường độ của ba kênh màu Swain và Ballard đề xuất biểu đồ màu giao, là biện pháp tương tự cho các biểu đồ màu sắc Hơn nữa, hầu hết các biểu đồ màu là rất thưa, gây lãng phí bộ nhớ và giảm độ chính xác khi thực hiện tra cứu ảnh, do đó Stricker và Orengo đề xuất sử dụng các biểu
đồ màu tích lũy thay vì sử dụng các biểu đồ màu thông thường
Bên cạnh các biểu đồ màu, nhiều đặc trưng màu khác được áp dụng trong truy xuất hình ảnh, bao gồm các khoảng màu và bộ màu Để khắc phục các hiệu ứng lượng
tử, như trong biểu đồ màu, Stricker và Orengo đề xuất sử dụng phương pháp mô-men khoảng màu Cơ sở toán học của phương pháp này là sự phân bổ bất kỳ màu sắc có thể được đặc trưng bởi những khoảng của nó Khoảng cách Euclide được sử dụng để tính toán các màu tương tự
Để tạo điều kiện tìm kiếm nhanh qua các bộ sưu tập ảnh quy mô lớn, Smith và Chang đề xuất thiết lập bộ màu như là một xấp xỉ với biểu đồ màu Đầu tiên họ chuyển đổi không gian màu (R, G, B) vào một miền không gian thống nhất, chẳng hạn như HSV, và sau đó lượng tử không gian màu sắc biến đổi thành các thùng M (M bins) Thiết lập màu được định nghĩa là sự lựa chọn các màu từ không gian màu lượng tử
Trang 18Bởi vì việc thiết lập các đặc trưng Vectorsrs màu là trong hệ nhị phân, một cây tìm kiếm nhị phân được xây dựng để tìm kiếm nhanh
Hình 1.2 Màu RGB
Màu là đặc trưng trực quan quan trọng đầu tiên và đơn giản nhất cho đánh chỉ
số và tra cứu các ảnh Nó cũng là đặc trưng được sử dụng phổ biến nhất trong lĩnh vực này Một ảnh màu tiêu biểu được thu từ một camera số, hoặc được tải xuống từ Internet thường có ba kênh màu (các ảnh xám chỉ có một kênh, các ảnh đa phổ có thể có nhiều hơn ba kênh) Tuy nhiên, các giá trị của dữ liệu ba chiều từ ảnh màu không cho chúng
ta một mô tả chính xác của màu trong ảnh, nhưng cho vị trí của các pixel này trong không gian màu Các pixel có các giá trị (1,1,1) sẽ xuất hiện khác nhau về màu trong các không gian màu khác nhau Vì thế mô tả đầy đủ của một ảnh màu tiêu biểu sẽ bao gồm thông tin không gian hai chiều cho biết nơi của pixel màu trong miền không gian màu, và dữ liệu màu ba chiều cho biết nơi của pixel màu trong không gian này
Ở đây không gian màu được giả thiết là cố định, thông tin không gian trong ảnh
bị bỏ qua, và thông tin màu trong một ảnh tiêu biểu có thể được xem như tín hiệu ba chiều đơn
Các tín hiệu màu một hoặc hai chiều cũng được sử dụng rộng rãi trong CBIR, đặc biệt trong các ứng dụng mà các điều kiện thu ảnh tương phản mạnh là quan trọng Thông tin màu ở dạng các tọa độ xy hoặc ab của các hệ thống CIE XYZ và CIE LAB
có thể được sử dụng trong các ứng dụng độc lập cường độ Thông tin màu (Hue) được
sử dụng trong các ứng dụng nơi chỉ sự khác biệt giữa chất liệu của các đối tượng trong
Trang 19cảnh là quan trọng Màu là bất biến dưới ánh sáng và thay đổi hình học của người quan sát và các góc chiếu sáng
Nếu coi thông tin màu của một ảnh như một tín hiệu một, hai, hoặc ba chiều, phân tích tín hiệu bằng việc sử dụng ước lượng mật độ xác suất là cách đơn giản nhất
để mô tả thông tin màu của ảnh Lược đồ là công cụ đơn giản nhất Các cách mô tả thông tin màu khác trong CBIR gồm sử dụng véc tơ gắn kết màu, tương quan màu, các màu trội, hoặc các dấu hiệu màu, và các momen màu
Do mọi pixel trong ảnh có thể được mô tả bởi ba thành phần màu trong một không gian màu nào đó, chẳng hạn các thành phần đỏ, xanh lam và xanh lơ trong không gian RGB, hoặc màu, độ sắc nét và cường độ trong không gian HSV; một lược
đồ (phân bố của số các pixel cho mỗi bin được lượng hoá) có thể được định nghĩa cho mỗi thành phần Rõ ràng, một lược đồ màu chứa nhiều bin hơn, nó có khả năng phân biệt tốt hơn Tuy nhiên, một lược đồ với một số lượng lớn các bin sẽ không chỉ tăng chi phí tính toán, mà cũng sẽ không thích hợp để xây dựng các chỉ số hiệu quả cho các cơ
sở dữ liệu ảnh
Hơn nữa, số lượng bin tốt không cải tiến hiệu năng tra cứu trong nhiều ứng dụng Một cách để giảm số các bin là sử dụng không gian màu đối lập cho phép độ chói của lược đồ được lấy mẫu xuống Một cách khác là sử dụng các phương pháp phân cụm để xác định K màu tốt nhất trong một không gian đã cho với tập các ảnh đã cho Mỗi màu tốt nhất này sẽ được chấp nhận như một bin lược đồ Do quá trình phân cụm lấy phân bố màu của các ảnh trên toàn bộ cơ sở dữ liệu ảnh vào xem xét, rất ít khả
Trang 20năng các bin lược đồ trong đó không có hoặc có rất ít pixel Một lựa chọn khác là sử dụng các bin có số pixel lớn nhất do một số nhỏ các bin lược đồ thu được phần lớn các pixel của một ảnh Một sự giảm như thế không làm giảm hiệu năng của đối sánh lược
đồ, mà còn có thể tăng cường nó do các bin lược đồ nhỏ coi như là nhiễu
Khi một cơ sở dữ liệu ảnh chứa một số lượng lớn các ảnh, so sánh theo lược đồ
sẽ bão hòa sự phân biệt Để giải quyết vấn đề này người ta sử dụng kỹ thuật lược đồ liên kết Ngoài ra, lược đồ màu không đưa thông tin không gian của các pixel vào xem xét, vì thế các ảnh rất khác nhau có thể có các phân bố màu giống nhau Vấn đề này trở nên đặc biệt sâu sắc với các cơ sở dữ liệu lớn Để tăng khả năng phân biệt, một số cải tiến đã được đề xuất để liên kết thông tin không gian Một cách đơn giản là chia một ảnh thành các vùng con và tính lược đồ cho mỗi vùng con này Một trong các cách chia đơn giản là phân họach hình chữ nhật, hoặc phân đoạn vùng, thậm chí phân họach đối tượng Tăng số các vùng con sẽ tăng thông tin về vị trí, nhưng cũng tăng về chi phí bộ nhớ và thời gian tính toán
1.2.2.3 Véc tơ gắn kết màu
Các Vectorsrs gắn kết màu (CCV) đề xuất mỗi bin lược đồ được phân thành hai loại là gắn kết (nếu nó thuộc về một vùng màu đồng nhất lớn), hoặc không gắn kết (nếu
pixel gắn kết và không gắn kết trong bin màu thứ i của một ảnh thì CCV của một ảnh
nó đã được chỉ ra rằng CCV cung cấp các kết quả tra cứu tốt hơn lược đồ màu, đặc biệt cho các ảnh hoặc có phần lớn màu đồng nhất hoặc có phần lớn các vùng kết cấu Ngoài
ra, với biểu diễn lược đồ và Vectorsrs gắn kết màu, không gian màu HSV cung cấp các
u*v* và CIE L*a*b*
Trang 211.2.2.4 Tương quan màu
Tương quan màu được đề xuất không chỉ để mô tả các phân bố màu của các pixel, mà còn tương quan không gian của các cặp màu Chiều thứ nhất và thứ hai của lược đồ màu ba chiều là các màu của mọi cặp pixel và chiều thứ ba là khoảng cách không gian của chúng Một tương quan màu là một bảng được đánh chỉ số bởi các cặp màu, ở đây mục thứ k cho (i,j) chỉ rõ xác suất tìm được một pixel có màu j tại một khoảng cách k từ một pixel có màu i trong ảnh Cho I biểu diễn toàn bộ tập các pixel
bằng:
, ,
2 ) 1
k j i
i c
gọi là tự tương quan màu thường được sử dụng thay thế Tự tương quan màu chỉ thu tương quan không gian giữa các màu thuần nhất và vì thế giảm số chiều xuống còn O(Nd)
Hình 1.3 Lược đồ màu CIE 1976
So sánh với lược đồ màu và véc tơ gắn kết màu, tự tương quan màu cho các kết quả tra cứu tốt hơn, nhưng cũng cho chi phí tính toán cao hơn do nó có chiều cao
Trang 22Ký hiệu mô tả đặc trƣng lƣợc đồ màu trội F đƣợc định nghĩa là một tập các cặp sau:
Về mặt toán học, ba momen đầu tiên đƣợc định nghĩa bằng:
) 3 1 ( f
N
1 j ij
) 4 1 ( )
) f
( N
1
1 2 i ij
) 5 1 ( )
) f
( N
1 (
1 N
1 j
3 i ij
Trang 23Do chỉ 9 số (ba momen cho mỗi một trong ba thành phần màu) được sử dụng để biểu diễn nội dung màu của mỗi ảnh, các momen màu là một biểu diễn rất nén so với các đặc trưng màu khác Do biểu diễn rất nén này, nó có thể cũng giảm khả năng phân biệt Thông thường, các momen màu có thể được sử dụng như sơ duyệt lần đầu để giảm không gian tìm kiếm trước khi các đặc trưng màu phức tạp khác được sử dụng cho tra cứu
1.2.3 Thông tin không gian
Các vùng hoặc đối tượng với các đặc tính màu và kết cấu tương tự có thể được phân biệt dễ dàng bằng việc tận dụng các ràng buộc không gian Thí dụ, các vùng bầu trời màu xanh và biển xanh có thể có các lược đồ màu tương tự, nhưng các vị trí không gian của chúng trong các ảnh là khác nhau Do đó, vị trí không gian của các vùng (hoặc các đối tượng) hoặc quan hệ không gian giữa nhiều vùng (hoặc đối tượng) trong một ảnh thì rất hữu ích cho tìm kiếm các ảnh
Thu thông tin không gian của các đối tượng trong một ảnh là một quá trình quan trọng đối với các hệ thống GIS Quá trình này bao gồm việc biểu diễn vị trí không gian tuyệt đối và cũng bao gồm vị trí không gian tương đối của các đối tượng Các thao tác như giao và chồng được sử dụng Bố cục màu kết hợp thông tin không gian với thông tin màu xuất hiện trong ảnh và tạo ra một đặc trưng rất quan trọng trong quá trình tra cứu, gọi là đặc trưng màu – không gian
Trang 24Biểu diễn quan hệ không gian được sử dụng rộng rãi nhất là các xâu 2D được
đề xuất bởi Chang và cộng sự Nó được xây dựng bởi việc chiếu các ảnh dọc theo các
trong V biểu diễn một đối tượng trong ảnh Mỗi ký hiệu trong A biểu diễn một loại
đối tượng dọc theo hình hộp tối thiểu của nó và mở rộng các quan hệ không gian thành hai tập toán tử không gian Một tập định nghĩa các quan hệ không gian cục bộ Tập còn lại định nghĩa quan hệ không gian toàn cục, chỉ ra rằng hình chiếu của hai đối tượng là
vị trí cho bắt đầu và kết thúc đường bao của đối tượng Tất cả các phương pháp này có thể hỗ trợ ba loại truy vấn Loại truy vấn 0 tìm tất cả các ảnh chứa đối tượng
n
2
chúng, nhưng khoảng cách giữa chúng là không đáng kể Loại 2 tìm tất cả các ảnh có quan hệ khoảng cách nào đó với mỗi ảnh khác
cho biểu diễn thông tin không gian Tuy nhiên, tìm kiếm các ảnh dựa trên các quan hệ không gian của các vùng còn lại một vấn đề nghiên cứu khó trong tra cứu ảnh dựa vào nội dung, do phân đoạn tin cậy của các đối tượng hoặc các vùng thường là không khả thi ngoại trừ các ứng dụng rất giới hạn Mặc dù một số hệ thống chia các ảnh thành các khối đều, chỉ thu được sự thành công khiêm tốn với các lược đồ chia không gian như thế do hầu hết các ảnh tự nhiên không thể ép thành các khối con đều về không gian Để giải quyết vấn đề này, một phương pháp dựa vào biến đổi radon, tận dụng phân bố không gian của các đặc trưng trực quan không cần phân đoạn phức tạp được đề xuất trong
1.2.4 Các đặc trưng mức cao
Phần lớn nghiên cứu tra cứu ảnh dựa vào nội dung hiện tại được tập trung vào các phương pháp tra cứu ảnh mức thấp Tuy nhiên, một số nhà nghiên cứu đã cố gắng
Trang 25để lấp khoảng trống giữa tra cứu mức thấp và mức cao Họ có khuynh hướng tập trung vào một trong hai vấn đề Vấn đề thứ nhất là nhận biết cảnh Nó thường là quan trọng
để nhận biết toàn bộ loại cảnh được mô tả bằng một ảnh, vì có điều này trong bộ lọc quan trọng có thể được sử dụng khi tìm kiếm, và vì có điều này có thể giúp xác định một đối tượng cụ thể có xuất hiện hay không Hệ thống loại này là IRIS, nó sử dụng màu, kết cấu, vùng và thông tin không gian để thu lại sự giải thích về cảnh có khả năng nhất, sinh ra các ký hiệu mô tả văn bản có thể được nhập vào đối với bất kỳ hệ thống tra cứu dựa vào văn bản Các nhà nghiên cứu khác đã nhận biết các kỹ thuật đơn giản hơn cho phân tích cảnh, sử dụng các thành phần ảnh tần số thấp để huấn luyện mạng neural, hoặc thông tin màu lân cận được trích rút từ các ảnh độ phân giải thấp để xây dựng các khuôn mẫu được định nghĩa bởi người sử dụng
Vấn đề tập trung thứ hai của các Hoạt động nghiên cứu là nhận dạng đối tượng, một lĩnh vực quan tâm đối với cộng đồng thị giác máy tính trong nhiều năm Giờ đây các kỹ thuật được phát triển cho nhận dạng và phân loại các đối tượng với tra cứu cơ sở
dữ liệu theo suy nghĩ Nghiên cứu tốt nhất trong lĩnh vực này là của, tác giả đã lôi cuốn bởi sự phát triển một kỹ thuật cho nhận dạng người trong các ảnh, mặc dù cách tiếp cận của ông đã được áp dụng đối với một phạm vi rộng các đối tượng, bao gồm ngựa và cây Tất cả các kỹ thuật này được dựa trên ý tưởng của sự phát triển một mô hình của mỗi dạng để nhận dạng, nhận biết các vùng ảnh có thể chứa các mẫu đối tượng, và xây dựng bằng chứng để xác thực hay loại bỏ sự hiện diện của đối tượng
1.3 Các nghiên cứu và ứng dụng liên quan đến cơ sở dữ liệu ảnh
Hai trường hợp nghiên cứu và ứng dụng liên quan đến ảnh, được nhiều người đề cập trong những năm qua tại Việt Nam Những nghiên cứu và ứng dụng này cần đến :
Trang 261.3.1 Ảnh trong GIS
Hệ thống thông tin địa lý GIS đƣợc hình thành vào những năm 1960 và phát triển rất rộng rãi trong 10 năm lại đây GIS ngày nay là công cụ trợ giúp quyết định trong nhiều Hoạt động kinh tế - xã hội, quốc phòng của nhiều quốc gia trên thế giới GIS có khả năng trợ giúp các cơ quan chính phủ, các nhà quản lý, các doanh nghiệp, các cá nhân đánh giá đƣợc hiện trạng của các quá trình, các thực thể tự nhiên, kinh tế
- xã hội thông qua các chức năng thu thập, quản lý, truy vấn, phân tích và tích hợp các thông tin đƣợc gắn với một nền hình học (bản đồ) nhất quán trên cơ sở tọa độ của các
dữ liệu đầu vào
Viện Công nghệ thông tin, Viện khoa học và công nghệ Việt Nam cúng có các kết quả liên quan đến hệ thống thông tin địa lí
Trang 27khiến cho GIS có phạm vi ứng dụng rộng trong nhiều lĩnh vực khác nhau (phân tích các sự kiện, dự đoán tác động và họach định chiến lược)
1.3.2 Đồ họa máy tính
Nhiều cấp học về công nghệ thông tin ở Việt Nam đưa môn xử lí ảnh vào chương trình đào tạo và huấn luyện Một số trung tâm sử dụng ảnh trong các dữ liệu đa phương tiện, trong khóa đào tạo về kĩ xảo điện ảnh, đồ họa máy tính…
Theo wikipedia, Đồ họa chuyển động là những hình ảnh đồ họa sử dụng cảnh quay video, hình động để tạo ra ảo giác về chuyển động hoặc xuất hiện động Đồ họa chuyển động thường kết hợp với âm thanh sử dụng trong các dự án đa phương tiện Đồ họa chuyển động được hiển thị qua các phương tiện truyền thông điện tử, tuy nhiên cũng có thể hiển thị qua các công nghệ khác
Ví dụ như Adobe Flash sử dụng kỹ thuật Tween máy tính cũng như kỹ thuật chuyển động frame by frame và video
Trang 28Kể từ khi khái niệm Đồ họa chuyển động thì hình thức này vẫn chưa được phân loại rõ ràng trong các hình thức nghệ thuật Vào những năm 1800 mới bắt đầu có những bài thuyết trình đề nghị phân loại riêng Đồ họa chuyển động Đồ họa chuyển động phát triển bắt nguồn từ việc sử dụng máy tính để chỉnh sửa những đoạn phim, có
lẽ để bắt kịp với công nghệ máy tính lúc bấy giờ Trước khi máy tính là một phần không thể thiếu, thì đồ họa chuyển động đỏi hỏi rất nhiều thời gian và công sức, và cả hạn chế về ngân sách sản xuất
1.3.3 Bản quyền về hình ảnh
1.3.3.1 Hình ảnh nhân vật
Việc công bố có thể bị giới hạn bởi quyền cá nhân của người được chụp Mỗi một con người về nguyên tắc đều có quyền tự quyết định là hình ảnh về mình nói chung có được phép công bố hay không và trong phạm vi nào
Tuy nhiên, cá nhân đang ở trong các buổi hội họp công cộng (thí dụ như biểu tình, lễ hội) hay tình cờ đứng trong quang cảnh được phép có thể được nhìn thấy trong các hình ảnh tương ứng mà không cần phải có sự đồng ý của họ Thế nhưng những người có liên quan này không được phép là mục đích của tấm ảnh Theo đó thì được phép chụp hình một nhóm đông những người hâm mộ bóng đá trên khán đài nhưng không được phép lấy một người hâm mộ bóng đá riêng lẻ ra mà không có sự đồng ý của người đó để chụp một tấm hình chân dung Ngoài ra luật pháp đã quy định là không được phép làm tổn hại đến các lợi ích chính đáng của người được chụp hình thông qua những hình ảnh được phép như vậy
Nhân vật nổi tiếng (nhân vật tuyệt đối của lịch sử đương đại, thí dụ như chính trị gia nổi tiếng) và nhân vật "đứng trong ánh sáng của công chúng" một thời gian ngắn (nhân vật tương đối của lịch sử đương đại, thí dụ như một người vừa mới cứu người khác khỏi chết đuối) có thể được ghi hình và truyền bá lại mà không cần có sự đồng ý của họ Tuy vậy cũng có nhiều ý kiến cho rằng chỉ được phép khi các nhân vật trên hình ảnh đó thật sự là đang có một chức vụ công cộng
Trang 29Theo luật Đức thì ngoài ra cũng không được phép nhìn trộm qua tường hay vượt qua các chướng ngại vật khác hay sử dụng những phương tiện giúp đỡ như ống kính chụp ảnh từ xa, thang hay cả máy bay để xâm phạm vào phạm vi riêng tư được bảo vệ của một nhân vật (nổi tiếng)
1.3.3.2 Tác phẩm nơi công cộng
Hình ảnh chụp những tác phẩm như tượng đài hay kiến trúc hiện đại hiện diện lâu dài trên đường phố và quảng trường công cộng đều có thể được phép công bố không cần phải lo ngại Nếu tác phẩm được bảo hộ về tác quyền được công bố trong không gian công cộng thì nên chú ý đến việc ghi chú nguồn gốc và một số giới hạn
nhất định của quyền được sửa chửa (Cho đến nay trong Wikipedia tiếng Đức có sự
đồng thuận là việc này không phải là một điều trở ngại cho việc đăng tải những hình ảnh này.) Điều này không có giá trị cho những tác phẩm nghệ thuật chỉ được công bố
(triển lãm) trong một thời gian ngắn nhất định trong công cộng
1.3.3.3 Công trình xây dựng
Việc công bố hình ảnh về các công trình xây dựng ở Đức (cũng như ở Áo và
Thụy Sĩ) nói chung là được bảo hộ bởi quyền tự do chụp toàn cảnh (Panoramafreiheit)
nhưng giới hạn nhìn từ bên ngoài Thêm vào đó là phải có thể đi đến điểm đứng để chụp hình mà không cần dùng phương tiện giúp đỡ Theo đó một cái thang, ngay khi chỉ được dùng chỉ để nhìn qua một chướng ngại vật, cũng không được phép như là một chiếc máy bay trực thăng Việc chụp từ một căn nhà khác cũng không được phép ngay
cả khi có phép đi vào điểm đứng để chụp hình
Hình 1.6 Một số ảnh lựa chọn
Trang 301.3.3.4 Vật thể trong không gian kín
Hiện đang có nhiều ý kiến khác nhau về tình trạng luật lệ cho những vật ở trong một phòng kín, thí dụ như trong viện bảo tàng hay trong một nhà trưng bày Đặc biệt là khi người "chủ nhà" cấm không cho chụp hình trong các phòng này hay chỉ cho phép dưới những giới hạn nhất định
Cũng không được phép công bố những hình ảnh mà trong đó có thể nhìn thấy những tác phẩm nghệ thuật vẫn còn được bảo hộ về quyền tác giả Các quyền này hết hạn 70 năm sau khi nhà nghệ thuật qua đời
Nếu tác phẩm được bảo hộ về tác quyền là một hình tượng khôi hài thì tất cả các
các sao chép và gia công tiếp theo (thí dụ như hàng merchandising) mà có thể nhận ra
hình tượng này trên đấy đều được bảo hộ về tác quyền và không thể đăng tải tại đây được Nếu chụp một chồng bìa đĩa hát mà bìa đầu tiên có thể được nhận thấy rõ thì đấy không phải là "hình tượng phụ" vì người nhiếp ảnh có ý định muốn cho thấy rõ bìa đầu tiên Tức là không thể tưởng tượng là không có trên hình Thế nhưng nếu hình tượng khôi hài này được gắn tại trụ sở của doanh nghiệp và có thể chụp được từ khu vực đường giao thông công cộng thì "tự do toàn cảnh" có hiệu lực
1.3.3.6 Biểu trưng
Biểu trưng không được hoan ngênh trên Commons vì thế mà nên truyền chúng lên Wikipedia tiếng Việt Chỉ có những hình dáng rất đơn giản không đạt được đến độ cao sáng tạo cần thiết hay là các biểu trưng trên các bảng được gắn cố định trong quang cảnh đường phố là được xem xét đến
Trang 311.3.3.7 Ảnh chụp màn hình
Việc sử dụng ảnh chụp màn hình để minh họa phần mềm cũng được tranh cãi
Từ những thảo luận về quyền hình ảnh có thể rút ra là các ảnh chụp màn hình tại Wikipedia không được bảo vệ bởi quyền trích dẫn và vì thế về cơ bản là không được phép Điều này cũng có giá trị cho các ảnh chụp màn hình từ các ghi hình truyền hình Chương trình thời sự trong truyền hình được phép tường thuật về Wikipedia với biểu trưng của Wikipedia nhưng Wikipedia không được phép làm một ảnh chụp màn hình
về tường thuật này vì các đài truyền hình có yêu cầu về việc bảo hộ quyền tác giả cho ngay cả các hình ảnh (không di động) từ chương trình của họ Các ngoại lệ là các ảnh chụp màn hình mà đã được người sở hữu tác quyền của chương trình phần mềm, trò chơi hay chương trình truyền hình đưa vào GFDL hay phạm vi công cộng
1.3.3.8 Sử dụng hình của người khác
Hình ảnh của người khác chỉ được phép truyền lên khi chúng không được bảo
hộ về tác quyền (hay có một giấy phép thích hợp) Trong đó cần phân biệt giữa những hình ảnh nói chung là không có khả năng được bảo hộ và những hình ảnh đã mất sự bảo hộ của pháp luật Thí dụ như một tấm ảnh thuộc về công cộng được xuất bản trong một quyển sách mà không được sửa chữa thì tấm ảnh này tất nhiên là có thể được sao chép lại tùy ý mà không cần có sự đồng ý của nhà xuất bản
1.3.3.9 Hình ảnh của tác giả vô danh
Điều cần phải chú ý là ngay cả khi không biết tác giả là ai hay không thể tìm ra tác giả với một công sức hợp lí thì vẫn có thể còn yêu cầu của những người kế thừa quyền theo pháp luật đối với những người sử dụng hình ảnh trong vòng 70 năm của thời hạn bảo hộ
Đối với những tác phẩm vô danh, điều 66 Luật quyền tác giả (Đức) quy định là
70 năm sau lần công bố đầu tiên quyền tác giả không còn nữa (hoặc là sau khi ra đời nếu như tác phẩm đã không được công bố 70 năm) Theo luật cũ nhưng vẫn tiếp tục có hiệu lực là đối với những hình ảnh ra đời trước ngày 1 tháng 7 năm 1995 thời hạn bảo
Trang 32hộ vẫn là 70 năm sau khi tác giả qua đời (post mortem auctoris) nếu như trong một thời
điểm nào đó tác giả cho biết danh tính của mình cho tấm ảnh Chứng minh là trường hợp này không xảy ra thì trên thực tế là không thể vì có thể rằng ở một lúc nào đó tác giả đã công bố tên mình, tên một tấm hình hay ở trên một công bố ở đâu đấy
1.4 Kết luận
Chương 1 đã trình bày một số khái niệm liên quan đến dữ liệu ảnh, trong cơ sở
dữ liệu đa phương tiện Một số đặc trưng của màu sắc, hệ thống màu sắc là phương tiện
để rút các đặc trưng của dữ liệu ảnh, cho phép chỉ số hóa và tìm kiếm dữ liệu ảnh theo nội dung Vai trò của dữ liệu ảnh nói riêng, dữ liệu đa phương tiện nói chung có ý nghĩa đối với tổ chức cơ sở dữ liệu ảnh đề cập trong chương sau
Một số nghiên cứu và ứng dụng liên quan đến dữ liệu ảnh được nêu ra, với ý thể hiện tính khả thi của tổ chức cơ sở dữ liệu ảnh đối với qui mô ứng dụng công nghệ thông tin vừa và nhỏ
Việc bảo đảm bản quyền về tác phẩm đa phương tiện nói chung và hình ảnh nói riêng rất cần thiết Nó tạo điều kiện phát triển cho người sáng tác và tạo hưng phấn cho các ý tưởng sáng tác
Trang 33Chương 2 TỔ CHỨC CƠ SỞ DỮ LIỆU ẢNH
2.1 Mô hình dữ liệu
2.1.1 Nhu cầu về mô hình dữ liệu
Người ta đã xác định mô hình dữ liệu là tập các mô tả và qui luật mô tả dữ liệu Trong DBMS, mô hình dữ liệu có vai trò cung cấp khung, hay ngôn ngữ, diễn tả các tính chất của mục tin được lưu trữ và tìm kiếm trong hệ thống Khung này cho phép người thiết kế và người dung xác định, thêm, bớt, sửa và tìm kiếm các mục cơ sở dữ liệu và tính chất của chúng Trong MIRS và hệ thống đa phương tiện, mô hình dữ liệu giả sử vai trò bổ sung là mô tả, tính toán các mức trừu tượng khác nhau từ dữ liệu đa phương tiện
Các mô hình dữ liệu đa phương tiện nắm bắt các tính chất tĩnh và động của các mục cơ sở dữ liệu, vậy nên cung cấp cơ sở hình thức để phát triển các công cụ phù hợp dùng với dữ liệu đa phương tiện Các tinh chất tĩnh gồm các đối tượng tạo nên dữ liệu
đa phương tiện, mối liên hệ giữa các đối tượng, thuộc tính đối tượng các tính chất động gồm tính chất liên quan đến tương tác giữa các đối tượng, phép toán trên các đối tượng, tương tác người dùng Sự phong phú của mô hình dữ liệu có vai trò tăng tính
sử dụng của MIRS Dù các kiểu dữ liệu đa phương tiện cơ bản đã có, nhưng đó chỉ cung cấp nền để xây dựng các đặc trưng
Không gian đặc trưng nhiều chiều là tính chất của chỉ số hóa đa phương tiện Một mô hình dữ liệu trợ giúp thể hiện không gian nhiều chiều, đặc biệt độ đo khoảng cách trong không gian đó Nhìn chung, mô hình dữ liệu MIRS cần đạt các yêu cầu sau:
1 Mô hình dữ liệu cần mở rộng được, để bổ sung kiểu dữ liệu mới
2 Mô hình dữ liệu cần thể hiện các kiểu phương tiện cơ bản và các đối tượng hỗn hợp với các quan hệ không gian và thời gian
Trang 343 Mô hình dữ liệu cần mềm dẻo để có thể mô tả, hỏi và tìm kiếm các mục theo các mức trừu tượng
4 Mô hình dữ liệu cho phép lữu trữ và tìm kiếm hiệu quả
Nhiều người cho rằng mô hình dữ liệu MIRS cần là mô hình hướng đối tượng
và phân cấp nhiều tầng Thiết kế OO đảm bảo đóng gói mã và dữ liệu vào cùng một đơn vị, gọi là đối tượng Mã này xác định các phép toán thực hiện trên dữ liệu Việc đóng gói làm tăng tính khối và che đi chi tiết về phương tiện cụ thể và việc xử lý Điều quan trọng hơn, tiếp cận OO cung cấp khả năng mở rộng do cơ thể tăng cường và mở rộng đối tượng đã có
Hình 2.1 Mô hình cơ sở dữ liệu đa phương tiện tổng quát