Chương 2: vấn đề lựa chọn mô hình cơ sờ dữ liệu cho cơ sờ dữ liệu đa phương tiện trình bày các mô hình cơ sở đữ liệu quan hệ, hướng đổi tượng và đối tượng quan hệ đề thấy được khả năng
Trang 2M Ụ C L Ụ C • ■
MỞ ĐẦU 4
CHƯƠNG 1: GIỚI THIỆU c ơ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 6
1.1 Nhu cầu cần có CO' sở dữ liệu đa phưorng tiện (CSDLĐPT) 6
1.2 Các nhiệm vụ thiết kế cơ sở dữ liệu đa phương tiện 8
1.2.1 Kiến trúc 9
1.2.2 Mô hỉnh dữ liệu 11
1.2.2.1 Yêu cầu 11
1.2.2.2 Mô hình dữ liệu đa phương tiện tổng quát 12
1.2.2.3 Mô hinh dữ liệu thí dụ 14
1.2.3 Thiết kế giao diện người sử đụng 18
1.2.3.1 Cơ sờ dữ liệu population 18
1.2.3.2 HỖ trợ truy vấn 19
1.2.3.3 Trình diễn kết quả 21
1.2.4 Trích chọn đặc trưng, chỉ mục và đo tương tự 21
1.2.4.1 Trích chọn đặc trưng 22
1.2.4.2 Chi số hỏa cấu trúc 24
1.2.4.3 Đo tính tương tự 24
1.2.5 Đảm bào chất lượng dịch vụ (QoS) trong client, server và hệ thống truyền tin 25
1.2.6 Các nhiệm vụ khác 26
1.2.6.1 Nén dữ liệu đa phương tiện 26
1.2.6.2 Chuẩn hóa biểu diễn dữ liệu 27
CHƯƠNG 2: VẤN ĐÈ L ự A CHỌN MÔ HÌNH c ơ SỞ D Ữ LIỆU CHO c ơ SỞ D Ữ LIỆU ĐA PHƯƠNG T IỆ N 28
2.1 Mô hình cơ sở dữ liệu quan h ệ 28
2.2 Mô bình cơ sở dữ liệu hướng đối tưọrng 29
2 3 Mô hình CO’sở dữ liệu đối tượng quan hệ 31
2.4 Mô hình quan hệ mờ rộng trong Oracle InterMedia 32
2.4.1 Quản lý nội dung đa phương tiện 33
2.4.3 Kiểu đối tượng ảnh ORDImage trong Oracle InterMedia 38
2.4.4 Kiểu đổi tuợng âm thanh ORDAudio 41
2.4.5 Kiểu đổi tuợng video ORDVideo 42
2.4.6 Lưu trữ dữ liệu đa phương tiện 43
2.4.7 Nạp dữ liệu đa phương tiện 44
2.4.8 Truy cập dữ liệu đa phương tiện 46
2.4.9 Phân phối nội dung dữ liệu đa phương tiện 52
LỜ I C Ả M Ơ N 3
Trang 32.4.10 Phương time truỵ vấn dữ liệu đa phương tiện theo nội dung 53
2.4.10.1 Khái niệm tổng quát và lợi ích 54
2.4.10.2 Thực hiện truy vằn dữ liệu dựa trên nội dung 55
2.4.10.3 Thực hiện ánh x ạ 61
2.4.10.4 Dùng chi mục để so sánh các dấu hiệu 66
2A 10.5 Lựa chọn ảnh để ánh xạ 67
2.4.11 Kiến trúc Oracle /rt/erMedia 69
2.4.12 Khả năng mở rộng cùa Oracle InterMedia 72
2.5 Mô hình đổi tượng quan hệ trong DB2 Extender 72
2.5.1 Giới thiệu DB2 extender và các cách thức mới tìm kiểm thông tin 73
2.5.2 Đặc điểm hướng đổi tượng 75
2.5.3 Khả nảng quản lý dữ liệu đa phương tiện 80
2 5.3.1 Lưu trữ 81
2.5.3.2 Truy vấn ; 82
2.5.3.3 Sửa đổi 82
2.5.4 DB2 extender hỗ trợ tìm kiếm ảnh theo nội dung 83
2.6 Nhận xét 86
CHƯƠNG 3: CÀI ĐẶT TH Ử NGHIỆM 87
3.1 Mô tả bài to á n 87
3.1.1 Mục tiêu 87
3.1.2 Yêu cầu 87
3.2 Lựa chọn công cụ và môi trường phát triển 88
3.3 Hướng dẫn cài đặt Oracle InterMedỉa và kiểm tra cài đ ặ t $8
3.3.1 Phận cài đặt 88
3.1.2 Kiểm tra kềt quả cài đặt 90
3.4 Mô tả các chức năng chính của chương trình thử ngh iệm 92
3.4.1 Sơ đồ chức năng 92
3.4.2 Mô tả các chức năng kèm theo hình ảnh 93
3.4.2.1 Các thao tác (nạp, xuất, sửa đối và xoá) trên đữ liệu 98
3.4.2.2 Thực thi dữ liệu âm thanh 102
3A.2.3 Tìm kiếm dữ liệu ảnh 104
3.5 Nhận xét phần thử nghiệm 108
KÉT LUẬN 110
TÀI LIỆU THAM K HẢO 112
Trang 4D a n h m u c c a c k y h i e u v i § t t a t
AIV Extender Audio Image Video Extender
DBCLOBs Double byte Character Large Objects
Trang 5M IM E M u ltip u rp o se In tern et M ail E x te n sio n s
O S O p e ra tin g S ystem
O ID O b je c t Id en tifier
O D B O b je c t D a ta b ase
O O D B O b je c t O rie n te d D atab ase
O R D B O b je c t R e la tio n a l D atab ase
Trang 6M Ở Đ À U
Những thay đổi của môi trường xã hội cùng với sự xuất hiện của nhiều công nghệ mới dẫn đến việc ngày càng có nhiều phương thức trao đổi và thể hiện thông tin Trước đây, con người thường thể hiện thông tin qua các văn bản bằng việc sử dụng các ký tự, số hoặc có thêm một số hình ảnh có ý nghĩa Nhưng ngày nay, thông tin truvền tải ý nghĩa của nó qua nhiều định dạng khảc nhau như âm thanh, số, hình ành có hiệu ứng, hay các đoạn phim sống động v.v Sự phong phú trong cách thể hiện các dạng truyền thông cho thấy các dạng dữ liệu đa phương tiện là sự kết hợp của nhiều dạng dữ liệu khác nhau ngày càng cỏ vai trò quan trọng.
Đã có nhiều đề tài nghiên cứu và phát triển các cách thức truvền thông và thể hiện
dữ liệu đa phương tiện, hoặc một sổ vấn đề về lưu trữ và truy xuất dữ liệu đa phương tiện qua các hệ quản trị cơ sở dữ ỉiệu sao cho hiệu quả Mặc dù trên thực tể có rất nhiều hệ quản trị cơ sở đữ ỉiệu được sử dụng để hỗ trợ cho vấn đề quản lý dữ liệu nhưng dường như các hệ quàn trị này chira thực sự có khả năng quản lý tốt các dạng dữ liệu đa phương tiện Do vậy cần có cơ sở dữ liệu chuyên biệt dùng để quản lý dữ liệu đa phương tiện là một nhu cầu tất yếu Xuất phát từ vấn đề trên mà để tài “Nghiên cứu ứng dụng cơ sở dữ
Nội dung trình bày phần nghiên cứu được chia làm ba chương:
Chương 1 : Giới thiệu cơ sờ dữ liệu đa phương tiện trinh bày nhu cẩu cẩn cỏ cơ sờ dĩr liệu đa phương tiện và các nhiệm vụ thiết kể cơ sờ dữ liệu đá phương tiện.
Chương 2: vấn đề lựa chọn mô hình cơ sờ dữ liệu cho cơ sờ dữ liệu đa phương tiện trình bày các mô hình cơ sở đữ liệu quan hệ, hướng đổi tượng và đối tượng quan hệ
đề thấy được khả năng ứng dụng riêng của từng mô hình cho các ứng dụng dữ liệu đa phương tiện Cũng trong nội dung chương 2, hai mô hình cơ sờ dừ liệu đổi tượng quan hệ
Trang 7nồi bật là Oracle InterMedia và DB2 Extender được trình bày đề phân tích các khả năng quân lý dữ liệu đa phương tiện.
Chương 3: Cài đặt thừ nghiệm một cơ sờ dừ liệu đa phương tiện trên hệ quản trị Oracle để kiểm tra khả năng hồ trợ đa phương tiện của thành phần Oracle InterMedia được tích hợp trong Oracle.
Phần kết luận tóm tắt các kết quả đạt được và đưa ra một số phương hưởng nghiên cứu để đánh giá được vai trò quan trọng cùa dữ liệu đa phương tiện trong nhiều lĩnh vực.
Trang 8C h ư ơ n g 1
G I Ớ I T H I Ệ U C ơ S Ở D ữ L I Ệ U ■ •
Đ A P H Ư Ơ N G T I Ệ N■
Mục đích của cbucmg này nhẩn mạnh đến tầm quan trọng của dữ liệu đa
phương tiện trong nhiều ứng dụng cùa cuộc sống dẫn đến nhu cầu lưu trữ và khai thác chúng sao cho hiệu quả Do vậy cần có cơ sở dữ liệu đa phương tiện (mục l.l)[2][3] Vậy khi xây dựng cơ sở dừ liệu đa phương tiện cần quan tâm đến những yếu tố nào? Mục 1.2 trình bày các nhiệm vụ chinh khi thiết kế cơ sờ dữ liệu đa phương tiện bao gồm kiến trúc, mô hình dừ liệu, thiết kế giao diện người sử dụng, trích chọn đặc trưng, đàm bảo chất lượng dịch vụ và một sổ nhiệm vụ khác [2][3],
1.1 N h u c ầ u c ầ n c ó c ơ s ử d ữ liệu đ a p h ư o n g tiện (C SD L Đ PT )
Thông tin đa phương tiện hay còn gọi là dữ liệu đa phương tiện, thể hiện các thông tin của nìáy tính qua các dạng truyền thông như video, sound, animation, images, alphanumerics hoặc có sự kết hợp giữa các dạng truyền thông này.
Dựa trên các loại dữ liệu truyền thông chủng ta có thể phân ra làm 2 dạng
truyền thông là tĩnh và động Dữ liệu tĩnh có nội dung và ý nghĩa không phụ thuộc
vào thời gian thể hiện như alphanumerics, images, graphics Dữ liệu động có nội dung và ý nghĩa phụ thuộc thời gian Chẳng hạn như khi thực hiện một đoạn video cần dịch chuyển khoảiig 25 đến 30 frames/giây để làm hình ảnh và âm thanh thay đổi Các dạng dữ liệu động khác như sound và animation đều có mối quan hệ với thời gian.
Việc truyền đạt thông tin và ý nghĩa cùa thông tin trong thực tế cũng cỏ rất nhiều phương thức khác nhau Tuy nhiên, với dữ liệu đa phương tiện, các thông tin truyền đạt ý nghĩa nhanh và dễ hiểu hơn Do vậy mà ngày nay dữ liệu đa phương tiện được sử đụng trong nhiều ứng dụng thực tế như nghệ thuật, giáo dục, giải trí,
kỹ thuật, y học, toán học, cả trong các nghiên cứu khoa học, v.v.
* 6
Trang 9-Ví dụ như trong giáo dục, dữ liệu da phương tiện được dùng để tạo ra các khỏa học dựa trên sự hồ trợ của máy tính (computer based training - CBTs) và các loại sách học khác Một chuơng trình CBT là một chuồi các trình diễn (presentations) bao gồm có text đề diễn giải cụ thể cho từng chù đề và có nhiều phẩn minh họa bằng việc sử dụng các định dạng dữ liệu khác Do vậy, người học sẽ thấy thoải mải và tiếp thu nhanh hơn với nhũng bài giảng có sử dụng đữ liệu đa phương tiện Trong lĩnh vực giải trí, dữ liệu đa phương tiện có vaí trò hết sức quan trọng giúp tạo ra các hiệu ứng và sự sống động trong các bộ phim, các chương trình trò chơi giài trí v.v Bên cạnh đó, các ngành như kỹ thuật máy, tự động hóa cũng sử dụng dữ liệu đa phương tiện như một công cụ hỗ trợ thiết kế mẫu mã sản phẩm dựa trên các phối cảnh khác nhau v.v Một trong những sản phẩm được biết đến đó tà chương trình thiết kế bằng máy tính (computer aided design - CAD).
Một sổ lĩnh vực ứng đụng dữ liệu đa phưcmg tiện kể trên cho thấy dữ liệu đa phương tiện đang ngày càng gia tăng và có vai ừò rất quan trọng trong việc truyền đạt thông tin đẫn đến những yêu cầu cần thiết về vấn đề quản lý như:
> Khả năng lưu trữ dữ liệu do kích thước dừ liệu đa phương tiện lởn hơn so với các dạng dữ liệu thông thường;
> Hỗ trợ truy vẩn nhanh dữ liệu đa phương tiện do thời gian truyền tải dữ liệu khi truy vấn không thể quả chậm vì tại mồi thời điểm ý nghĩa của dữ liệu đa phương tiện có thể thay đổi.
Hiện nay, có nhiều hệ quản trị cơ sở dữ liệu (HQTCSDL)(Database Management Systems - DBMS) cho phép người dùng tạo và quàn trị các loại cơ sở
dữ liệu (CSDL)(Database - DB) khác nhau Mồi một CSDL là một tập hợp dữ liệu
có quan hệ với nhau Khi làm việc với CSDL thì dữ liệu được xem như một tập các bản ghi.
Tuy nhiên, do dừ liệu đa phương tiện có nhiều kiểu dữ liệu khác nhau, cân được ]ưu trữ dưới các hỉnh thức và định dạng khác nhau vì vậy cần có CSDLĐPT Ngoài chức năng lưu trữ dữ liệu, người sừ dụng còn có thể thực hiện các thao tác
Trang 10cập nhật, sửa, xoả v.v trên CSDLĐPT như một cơ sờ dừ liệu truyền thổng và khai thác thông tin từ CSDL đó phục vụ cho mục đích của người sử dụng.
Xuẳt phát từ những yêu cầu đặt ra, để thực hiện quản lý tốt dừ liệu đa phương cần có một hệ quàn trị CSDLĐPT chuyên biệt được xây dựng theo một phương pháp chung:
> Xác định mô hinh CSDL (quan hệ đối tượng - quan hệ, hưởng đối tượng);
> Xây dựng kiến trúc cho CSDL;
> Xác định các nội dung cần lưu trừ;
> Xây dựng các kiểu dữ liệu, các đối tượng dữ liệu mà ứng dụng cần lưu trữ trong đó bao gồm các phương thức đi kèm với các đối tượng, v.v.
Để hiểu rõ han các yêu cầu trên, mục 1.2 sẽ trình bày các nhiệm vụ thiết kế CSDLĐPT.
1 2 C á c n h i ệ m v ụ t h i ế t k ế CO' s ở d ữ l i ệ u đ a p h ư ơ n g t i ệ n
Phần này khảo sát các vấn đề bao gồm:
> Khái quát về kién trúc môđun CSDLĐPT Các môđun chính của CSDLĐPT bao gồm giao diện người sử dụng (User Interface - UI), trích chọn đặc trưng, quản lý truyền tin, quản lý lưu trữ, chỉ số hỏa và công cụ tìm kiếm.
> Mô hình dữ liệu của CSDLĐPT xác định thông tin được tổ chức và lưu trữ như thế nào, hỗ trợ loại truy vấn nào (query) Các yêu cầu về mô hình dữ liệu cùa CSDLĐPT và sự phân cấp mô hình dữ liệu cũng sẽ được trình bày.
> UI - giao diện người sử dụng cung cấp công cụ chèn các items của cơ sờ
dữ liệu, câu truy vấn và trình diễn kết quả truy vấn.
> Trong CSDLĐPT, các đặc trưng và thuộc tính c ù a dừ liệu đ a phương tiện được trích chọn và lưu trữ với dữ liệu Các đặc trưng được tổ chức nhờ cấu trúc chi mục để tìm kiểm hiệu quả Ngoài ra còn cỏ hình thứ tìm kiếm dựa
Trang 11trên ca sò thước do tương tự giữa đặc trưng tpjv vấn và đặc trưng dữ liệu.
> Tim kiếm và trinh diễn đa phương tiện phái đáp ứng một số ràng buộc về thời gian và không gian Các ràng buộc này được xác định bàntỉ các yêu cầu về chất lượng dịch vụ (Quality of Serv ice - QoS) cùa đối tượng và ứng dụng đa phương tiện Mọi phân hệ bao gồm hệ điểu hành (Operating System - OS), truyền tin, quàn lý lưu trữ phái làm việc cùng nhau để đạt được QoS mong muốn.
> Các nhiệm vụ khác bao gồm nén dừ liệu, chuẩn trình diễn dữ liệu, tiến trình truy vẩn cũng cần được quan tâm.
1.2.1 Kiến trúc
Kiến trúc CSDLĐPT cần mềm dẻo và dễ mờ rộng để hỗ trợ các ứng dụng, truy vấn nội đung khác nhau Để đạt yêu cầu này CSDLĐPT bao gồm nhiều môđun chức năng quản lý Bộ quàn lý mới có khả năng mờ rộng chức năng của CSDLĐPT
dễ dàng.
Cơ chế khác cùa CSDLĐPT là khả năng phân tán tự nhiên, nó bao gồm nhiều server và client Cơ chế này hình thành từ đặc điểm kích thước dữ liệu đa phương tiện rất lớn và nhu cầu ứng dụng đồng thời của nhiều người tại một thời điểm như hệ thống thư viện sổ và hệ thống video theo yêu cầu.
9
-H ìn h 1.1 : K iến tr ú c cơ sở c ủ a C S D L Đ P T
Trang 12Chèn mục đa phưong tiện mới:
Người sử dụng đặc tả một hay một nhóm mục dữ liệu đa phương tiện thông qua UI Các mục được lưu trong tệp hay nhập trực tiếp từ thiết bị ngoài như microphone, CD player, VCR hay video camera Người sử dụng cũng có thể tự vẽ hình làm dữ liệu đầu vào Nội dung của chúng được trích trọn tự động hay bán tự động bằng các công cụ của bộ trích chọn đặc trưng Các đặc trưng này và các mục gốc được gửi về máy chù thông qua bộ quàn lý truyền tin Tại máy chù, các đặc trưng được tổ chức (chèn) theo lược đồ chì số hóa nào đó để truy vấn hiệu quả thông qua mô tơ truy vấn và chỉ số hóa Các thông tin chi số và các mục gốc được lưu trừ phù hợp thông qua bộ quản lý lưu trữ.
Truy vấn thông tin:
Người sử dụng đưa ra hay đặc tà truy vấn thông qua UI Truy vấn có thể là tệp lưu trữ trên đĩa hay nhập từ thiết bị vào (bàn phím, chuột) Có thể duyệt các mục trong CSDL để sử dụng nó làm mục truy vấn Nếu mục truy vấn không phải là cái
đã có sẵn trong CSDL, các đặc trưng chính của truy vấn được trích chọn theo cách như khi thực hiện chèn mục đữ liệu Các đặc trưng này được gửi đến máy chủ thông qua bộ quản lý truyền tin Môtơ chi sổ hóa và tìm kiếm tìm trong CSDL để có các mục dữ liệu phù hợp với các đặc trưng truy vấn Các mục này được truy vấn nhờ bộ quản lý lưu trừ và gửi đến UI thông qua bộ quản lý truyền tin UI hiển thị danh sách các mục dữ liệu tới người sử dụng.
Hình 1.1 là kiến trúc cơ sờ Có thể bổ sung các khối chức năng hay bộ quản
lý để đáp ứng yêu cầu từng ứns dụng cụ thể Chúng có thề là:
> Bộ quản lý từ điển đồng nghĩa: Đảm bảo đồng bộ và các quan hệ khác giữa
Trang 13Mô hình đừ liệu đa phương tiện thu thập thuộc tính tĩnh và thuộc tính động của các mục dừ liệu, cung cấp cơ sờ hình thức để phát triển các công cụ phù hợp, cần thiết khi sử dụng dữ liệu đa phương tiện Đặc tính tĩnh bao gồm các đối tượng hinh thành nên đừ liệu đa phương tiện, quan hệ giữa các đối tượng và các thuộc tính đối tượng Thí dụ các đặc tinh động bao gồm các đặc tính liên quan đến tương tác giữa các đối tượng, các thao tác trên đối tượng, tương tác với người sử dụng
Mô hình dữ liệu phong phú đóng vai trò quan trọng vào tính ứng dụng được cùa CSDLĐPT Các kiểu dừ liệu đa phương tiện cơ bản được hỗ trợ để cung cấp nền tảng hình thành các đặc trưng bổ sung.
Không gian đặc trưng đa chiều là đặc tính của chì số hóa đa phương tiện Mô hình dừ liệu cần hỗ trợ trình diễn không gian đa chiều này, đặc biệt thước đo khoảng cách trong nó.
Tóm lại, mô hình dữ liệu cùa CSDLĐPT cần đáp ứng các yêu cầu chính sau đây:
>'• Mô hình dữ liệu cỏ thế mở rộng để có thể bổ sung kiểu dữ liệu mới.
Trang 14> M ô hình dử liệu có khả năng trinh diễn kiểu dừ liệu cơ sờ và các đối tượng
tồ hợp với các quan hệ không gian và thời gian phức tạp
> Mô hình dữ liệu mềm dẻo sao cho các mục dừ liệu có thể được đặc tà, truy van và tìm kiếm trên các mức trừu tượng khác nhau
> Mô hỉnh dữ liệu cho phép lưu trữ và tìm kiếm hiệu quà
1.2.2.2 Mô hình dữ liệu đa phương tiện tổng quát
Mô hình dữ liệu cùa CSDLĐPT này hình thành trên nền tàng nguyên tắc hướng đối tượng và phân cấp đa tầng (hình 1.2)
Trang 15của mỗi mục Phương pháp chuna, đặc tả thời gian là dặc tã trên cơ sờ trục thời gian trong đó thời gian bắt đẩu và độ dài mồi mục được xác định trên cơ sờ đồng hồ chung Phương pháp khác là mô hình điều khiển theo sự kiện.
T ầ n g k h u ô n m ẫu m edia
Tầng này đặc tả khuôn mẫu d ữ liệu được lưu trừ Các dạng truyền thông thường có nhiều khuôn mẫu khác nhau, thí dụ ảnh có dạng nén hay thô Hơn nữa có rất nhiều kỹ thuật và chuẩn nén khác nhau Thông tin chứa trong tầng nảy được sử dụng để giải mã, phân tích và trình diễn
C ác n hiệm vụ khác
Các ứng dụng khác nhau có thể cần các mô hình dữ liệu khác nhau Tuy nhiên nhiều ứng dụng cùng chia sè mô hình cơ sờ chung, nếu được thiết kế tốt thì có thể bổ sung các đặc trưng và đối tượng mới để đáp ứng yêu cầu ứng đụng cụ thể
Hiện nay không có chuẩn chung cho các tầng mô hình dữ liệu mô tả trên Lý
do là các ứng dụng CSDLĐPT hiện nay chù yếu là đặc thù, chỉ tập trung vảo một số đặc trưng và các dạng truyền thông chính Có rất nhiều công việc phải làm khi mô hình hóa d ữ liệu đa phương tiện để phát triển CSDLĐPT lớn nhất quán
1.2.2.3 Mô hình dữ liệu thí dụ
Mô hình trên hình 1.2 là mô hình dữ liệu tổng quát Tuy nhiên, mỗi ứng dụng
có thể sử dụng mô hình đừ liệu riêng Phẩn mô tả sau đây nêu lên một vài mô hình
dữ liệu lảm thí dụ, bao gồm: Hệ thống quản lý ìhông tin trực quan (virtual
Trang 16information management svstem - VIM SYS) mô liinh video lỏng quan và câu trúc lược đồ sừ dụng trong mô tơ tìm kiếm ảnh Virage Các ý tưởng và đặc trưng của các
mô hình này được áp dụng vào định nghĩa chi tiết mô hình dữ liệu đa phương tiện tồng quát
T h í dụ 1: M ô hình d ữ liệu hệ th ố n g qu ản lý th ô n g tin trự c q u an - V IM SY S
M ô hình VIMSYS được hình thành để quàn Ịý các thông tin trực quan (ảnh
và video) Nó bao gồm bốn tầng: Tầng trinh diễn, tầng đối tượng ảnh, tầng đổi tượng lĩnh vực và tầng sự kiện-lĩnh vực (hình 1.3) Mọi đổi tượng trong mỗi tầng có tập các thuộc tính và phương thức
Lĩnh v ự c tri th ứ c
T ầ n g đổi tư ợ n g ản h
Trang 1715
-'lang này bao gom hai tầng con; rằng con phân doạn và tầng con dặc trung
Tầne con phân đoạn làm có đọng thông tin loàn bộ ảnh hay video vào cụm đặc tính về không gian và thời gian Các đặc trung cục bộ này có thể được tim kiếm trực tiếp Tầng con này phụ thuộc mạnh vào kỹ thuật phân đoạn ảnh và video
Tầng con đặc trưng chứa các đặc trưng hiệu quả cho tính toán, được tổ chức theo cấu trúc dữ liệu và tuân theo tính toán khoảng cách để phát sinh tỳ sổ xếp hạng (ranking score) Các đặc trưng chung bao gồm lược đồ màu, hình đạng đối tượng và kết cấu
T h í d ụ 2: M ô h ìn h video tổng q u á t
Mô hình video tổng quát bao gồm 4 tầng: frame, shot, scene (hay sequence)
và episode (video document) như trên hình 1.4
> Frame là các video và ảnh độc lập
> Shot là tập các frames được ghi hình bằng camera trong một lẩn bâm máy
> Scene là tập các shot có cùng ngừ nghĩa
> Episode ià tập các scenes trong trình tự cụ thể Đó là một đơn vị sản phẩm(thí dụ, chương trinh bản tin TV)
Trang 18-16-H ình 1.4: M ô hình video tồng q u á t
Các thuộc tính được gẩn vào từng mức video Tại tầng episode, ta có thể gán
dừ liệu thực sự như tiêu đề, tác giả, ngày tháng tạo lập và các thông tin liên quan đến kiểu viđeo như chương trình tin tức Scene chứa ngữ nghĩa chung chia sẻ giữa các shot của nó Các shot dược đặc trưng bời các frames chính của nó và các dữ liệu khác như các đối tượng chính ngày tháng và nơi quay hoặc chụp Mồi frame chứa ảnh và đừ liệu thống kê ảnh như biểu đồ màu
T h í đ ụ 3: c ấ u trú c lưực đồ ản h V irag«
Mô tơ tìm kiếm ảnh Virage cung cấp khung làm việc mở để hình thành các
hệ thống truy tìm ảnh trên cơ sờ nội dung, c ấ u trúc lược đồ m ôtơ này bao gồm 3 mức: lược đồ, sơ khai (primitive) và kiểu dữ liệu
> Trong hệ thống truy tỉm ảnh, 5 kiểu dữ liệu trừu tượng được nhận ra, bao
Trang 19> Kiểu dừ liệu cơ bàn là tập hợp các véctơ với các thao tác sau:
• Tạo lập tập họp: tạo lập tập hợp rồng cho các véctơ
• Tạo lập véctơ: trích chọn và tạo lập véctơ đặc trưng cụ thể từ ảnh
sừ dụng hàm trích chọn đặc trưng cụ thể
• Trích chọn: xâm nhập một phần từ cùa tập họp
• Khoảng cách: so sánh hai véctơ và cho lại thước đo khoàng cách giữa chúng trẽn cơ sở hàm khoảng cách cụ thể cho loại véctơ
• Tổ hạp; tạo véctơ mới bằng cách tổ hợp hai véctơ cho trước
• Hủy véctơ: giài phóng vùng nhớ kết hợp véctơ cụ thể
• Hủy tập hợp: hủy tập hợp khỏi bộ nhớ
Mức tiểp theo cùa thí dụ này tà các thuộc tính sơ khai (primitive) Sơ khai được định nghĩa như tập hợp các véctơ biểu diễn một loại thông tin ảnh Do vậy, primitive là đặc trưng có ý nghĩa của ảnh như màu, kểt cấu và hình dạng Nó được đặc tả bởi định danh duy nhất, tên loại, các hàm quàn lý và truy tìm dữ liệu
Tại mức cao nhất cùa cấu trúc lược đồ là lược đồ mà nỏ được định nghĩa bởi
bộ nhận danh lược đồ và tập thứ tự các primitive M ột ứng dụng cỏ thề định nghĩa
và sử dụng nhiều lược đồ Các chức năng chèn và truy tìm thông tin ảnh trên cơ sờ nội dung là ở mức này
1.2.3 Thiết kế g ia o d iệ n n g ư ò ĩ sử d ụ n g
Người dùng sử dụng, giao tiếp và tương tác với CSDLĐPT thông qua giao diện người sử dụng (UI - User Interface) Do vậy, UT phàn ánh khả năng sử dụng CSDLĐPT Các chức năng chính cùa UI là cho phép người sừ dụng chèn items vào
ĐAI HOC QUỐC GIA HÀ NỘI ĨRUNG TÂM THÔNG TIN THƯ VIỆN
Trang 20I S’ _
lò
-CSD I, nhập câu truy vấn và trinh diễn kết quà truy vấn UI tốt phải thỏa mãn các yèu cầu sau:
> Cung cấp các công cụ để người đùng dễ dàng chèn các items CSDL;
> Cung cấp công cụ giúp người đùng nhập hiệu quà câu truy vẩn hay thông báo cho hệ thổne các thông tin nó cần;
> Trình diễn hiệu quả kết quả truy vẩn;
> Thân thiện
Có rất nhiều việc phải làm để đáp ứng các yêu cầu trê n ‘đối với dữ liệu và ứng dụng đa phương tiện
L 2.3.1 Cơ sở dữ liệu population
Trong CSDL truvền thống, mỗi bản ghi có cấu trúc cố định với tổng sổ cố định các thuộc tính Mỗi bản ghi được chèn vào CSDL bằng ngôn ngữ như SQL
Trong CSDLĐPT thì các item CSDL có thể là kiểu bất kỳ hoặc là tổ hợp nhiều kiểu dữ liệu đa phương tiện Chúng không có cấu trúc và thuộc tính cổ định
Do vậy, UI phải có khả năng để người sử dụng xác định kiểu đầu vào khác nhau, tổ hợp các đổi tượng đa phương tiện và chi ra kiểu thuộc tính sẽ trích chọn và chi sổ hóa Yêu cầu UI phải là tổng quát để chèn tính tương tự truy vấn theo thí dụ (Query
by example)
Việc xử lý thông tin đa phương tiện và trích chọn đặc trưng đòi hỏi nhiều tính toán, thông thường từ (vài giây)/(đổi tượng) đến (vài giờ)/(đối tượng phức tạp) như phim Do vậy phải có khả năng đặc tả các thao tác trên nhóm đối tượng Việc trích chọn đặc trưng phải được tự động hóa hoàn toàn
L 2.3.2 Hồ trợ truy vấn
Truy vẩn đa phương tiện là đa dạng và mờ Nó đa dạng vì người sừ dụng có thể chỉ ra truy vấn theo nhiều cách và với nhiều kiểu dữ liệu đa phương tiện khác nhau Nó m ờ vì người sử dụng biết họ đang tìm gi nhưng khá khó khăn khi mô tà
Trang 21chính xác nó, hay các thôniỉ tin cân thiêt khônu dược dịnh nghĩa chính xác (họ chi nhận ra item khi nhìn thay) Đề thòa màn các yêu cầu về các đặc tính này, các còng
cụ tim kiếm, duyệt và làm mịn truy vấn cần phài có sẵn trong hệ thống
Tìm kiếm
Tim kiếm là nhiệm vụ cơ bản của mọi hệ quản trị CSDL Trong CSDLĐPT
cỏ hai loại tìm kiểm:
> Tìm kiếm theo đặc tả: người sử dụng sử dụng một số từ khóa và tham số để
mô tà các đặc trưng và thuộc tính chính về nhu cầu thônsĩ tin của họ
> Tìm kiếm theo thí đụ
Khó khăn là ánh xạ như thế nào các mô tá cùa người sử dụng bàng ngôn ngữ
tự nhiên thành các mẫu (pattern) dữ liệu đa phương tiện để có thể đo được Thí dụ, người sử dụng đặc tả truy vấn như “xe ôtô đò” Giả sử các ảnh trong CSDL không
tô màu đầy đủ nhưng nó chứa biểu đồ màu và hình dạng đổi tượng ảnh Câu hòi là giá trị pixel nào được sừ dụng để mô tà “đỏ” và hình dạne nào là “xe ô tô” Để tìm kiếm hiệu quả, hệ thống cần cung cấp hướng dẫn chi tiết về đặc tả truy vấn thông qua UI
Khó khăn của ánh xạ nói trên có thể vượt qua bằng cách tìm kiếm theo thí
đụ Trong trường hợp này, UI cho phép người sử dụng chí ra truy vấn theo nhiều dạng khác nhau hay tổ hợp các loại dữ liệu truyền thông khác nhau Truy vẩn bâv giờ là đối tượng thí dụ và sẽ hòi hệ thống để tìm ra items tương tự đối tượng thí dụ Trong trường hợp trên, người sử dụng phải vẽ hình dạng xe ô tô và tô màu đỏ Hệ thống sẽ tính toán biểu đồ màu, tham số hinh dạng của truy vấn và tìm kiếm các items có biểu đồ màu và tham số hình dạng tương tự Đề hỗ trợ loại truy vấn nảy,
UI cần cung cấp các công cụ đầu vào khác nhau như microphone, công cụ đồ họa, video camera, scanner và các công cụ authoring đa phương tiện khác Người sừ đụng cần có khả năng sử dụng các items trong CSDL như truy vẩn
Trang 2220
-D uyệt
Đôi khi người sừ đụng không biết chinh xác cái họ muốn nhung nhận ra cái
họ cần khi nhìn thấy nó Loại thông tin này cần đưực đáp ứng bởi duyệt Ba phương pháp khởi đầu đuvệt:
> Bắt đầu từ truy vấn không rõ ràng sau đó người dùng dẫn đường qua các items trên cơ sở các kết quả
> Đòi hỏi các thông tin trong CSDL được tổ chức theo vài tiêu chí nào đó (ngày tháng, chù điểm) để người sừ dụng cỏ thể duyệt theo các tiêu chí nảy
> Chọn ngẫu nhiên một sổ item(s) từ CSDL để trình diễn và người dung có thể sử dụng chúng như điểm khải đầu cho việc duyệt Nếu không tìm thấy items thỏa mãn, người dùng có thề chọn ngẫu nhiên nhóm khác để trinh diễn
Để duyệt hiệu quả, các items thông tin cần có tồ chức tốt và hình thành các biểu tượng con để trình diễn thay cho trình diễn toàn bộ đối tượng trong khi duyệt Với ảnh ta sử dụng ảnh thumbnail Với video sẽ sừ dụng frame đại diện hay biếu tượng phim 3D
L àm mịn tru y vấn
Phần lớn truy vấn khởi đầu là m ờ và không chính xác UI cần cung cấp công
cụ để người dùng làm mịn truy vẩn trên cơ sờ kết quả truy vấn ban đầu Làm mịn truy vấn được thực hiện thông thường trên cơ sở phản hồi của người dùng từ kết quả khởi đầu Khi người dùng nhìn thấy mục gần nhu cái họ mong muốn thì họ có thể tích hợp các đặc trưng của items vào truy vẩn mới Sau vài lẩn lặp, người dùng
có thể tìm thấy mục ỉiên quan Tri thức lĩnh vực và thông tin mà người đùng sử dụng đề làm mịn truy vấn
Trong thực tế, định vị thông tin đa phương tiện là tổ hợp tìm kiếm, duyệt và làm mịn truy vấn
Trang 23CSD LĐ PT trình diễn kết quà truy vấn thông qua UI Có nhiều việc phải làm
để trình diễn kết quả bao gồm:
> UI có khà nàng trinh diễn mọi loại media và quản lý các quan hệ không gian và thời gian của chúng (là nhiệm vụ đàm bảu QoS)
> Thông tín kết quã có thể chứa trong nhiều đoạn aucỉio dài, ảnh lớn hay video dài Nhiệm vụ lả phải tách, xây dựng và trình diễn các thông tin chính để người đùng duyệt và chọn Nói cách khác là đòi hỏi các kv thuật xây dựng cấu trúc (quang cảnh) thông tin sao cho ngươi dùng có thể nhận biết nhanh cái gì đang cỏ Ảnh thumbnail (ảnh thu nhò) hav biểu tượng phim là các công cụ đặc biệt quan trọng
> Thời gian đáp ứng hệ thống phải ngẳn Thời gian đáp ứng được xác định bởi phân hệ truyền tin và tìm kiểm trong CSDL Một kỹ thuật để có cảm giác giảm thời gian đáp ứng là giải mã tăng dần (progressive) và hiển thị
> Trinh diễn kết quà phải phàn hồi dễ dàng và làm mịn truy vấn
1.2.4 Trích chọn đặc trưng, chỉ mục và đo tương tự
Các đặc trưng và thuộc tính của dữ liệu (items) trong CSDLĐPT được trích chọn, tham số hóa và lưu trữ chung với chính các dữ liệu Các đặc trưng và thuộc tính của truy vấn cũng được trích chọn theo cùng cách thức nếu nó không được xác định rõ ràng trước Hệ thống tìm kiếm các items trong CSDL với các thuộc tính và đặc trưng tưomg tự trên cơ sờ thước đo tính tương tự nhất định Để tim kiếm hiệu quả, các dặc trưng và thuộc tính phải được tổ chức thành các cấu trúc có chi số
1.2.4 ỉ Trích chọn đặc trưng
Các mục thông tin đa phương tiện trong CSDL được tiền xử lý để trích chọn đặc trưng và thuộc tính
Trong tiến trình tìm kiếm, các đặc trưng và thuộc tính này được tìm kiếm và
so sánh thay cho chính các mục thông tin Do vậy chất lượng của trích chọn đặc
1 2 3 3 T r ìn h d iê n k ế t q u ả
Trang 24Irưng xác định hiệu quá tìm kiếm Ncu đặc trung khỏnu được tách ra tìr item nào thì không thề tìm thấy chúng tứ CSDL theo dặc trim s đó Đó là một trong sự khác biệt lớn nhất giữa CSDLĐPT và các HQTCSDL truyền thống khác Trích chọn đặc trưng phái thòa mãn các yêu cầu sau:
> Đặc trưng và thuộc tính trích chọn phái đẩy đù nhất có thể để biểu diễn nội dung của các mục thônu, tin
> Các đặc trưng phải được trình diễn và lưu trữ một cách chặt chẽ, mạch lạc Các đặc trưng phức tạp và lớn không phải là mục đích cùa trích chọn, nó phải có khả năng tìm kiếm và so sánh nhanh các mục thông tin với nhau
> Tính toán khoảng cách giữa các đặc trưng phải hiệu quà, nếu không thời gian đáp ứng của hệ thống rất lớn
Tổng thể có 4 mức đặc trưng và thuộc tính như sau:
> Siêu d ữ liệu (M e tad a ta ): bao gồm các thuộc tính của các đối tượng đa phương tiện như tên tác giả, ngày tạo lập, tiêu đề đối tượng Không mô tả hay diễn giải nội dung cùa đối tượng Các thuộc tính này được quản lý bàng kỹ thuật cùa HQTCSDL (Trong một số tài liệu, siêu dữ liệu bao gồm toàn bộ các mức đặc trưng và thuộc tính đang mô tả tại đây)
> M ô tả b ằ n g văn b ản : M ô tà nội dung đối tượng bẩng văn bản Mô tả dưới hinh thức nhiều từ khóa hay văn bản thông thường Chỉ sổ hóa và tìm kiếm trên cơ sở mô tả bằng văn bản được quàn lý bàng kỳ thuật truy tìm thông tin (Information Retrive - IR) Mặc dù mô tả bầng văn bàn có giới hạn là còn tính chủ quan và chưa đầy đủ nhưng đây vẫn là phương pháp hay được
sừ dụng và hiệu quả Nên sừ dụng mô tả bằng văn bản kết hợp vói các đặc trung khác trong ứng dụng đa phương tiện Hiện tại, mô tả văn bản được thực hiện thủ công nên khá vất và c ầ n phát triển các công cụ bán tự động
để hỗ trợ tiến trình này Tri thức lĩnh vực và từ điển liệt kê luôn có ích để đạt được hiệu năng íruy vấn cao
> Đ ặc trư n g nội d u n g m ức th ấ p : Thu thập các mẫu và thống kê đổi tượng
Trang 25đa phương tiện và các q u a n hệ khòníi lỊÌan, thời gian giũa các phẩn đối tượng Mỗi kiểu dừ liệu đa phưong tiện khác nhau có các đặc tnrrm nội duno mức thấp khác nhau.
• Với âm thanh, đặc trưng mức thấp bao gồm âm lượng trung bình, phân bổ tẩn sổ và tý lệ câm
• Các đặc trưng mức thấp c ù a ảnh bao gồm phân bổ màu, texture (kết cấu nền), hình dạng đối tượng và cẩu trúc không gian
• Đ ặc truna mức thấp của video là cấu trúc thời gian
• Lợi thế chính của việc sử dụng đặc trưng mức thấp là có thể tự động trích chọn chủng
> Đặc trư n g nội dung m ức cao: c ố gắng nhận biết và hiểu đối tượng Ngoài nhận dạng văn bản và tiếng nói việc nhận dạng và hiểu đoạn âm thanh và các đổi tượng nhin là rất khó khàn Trong ứng dụng với giới hạn
số lượng đối tượng, việc mô tả và nhận biết các đối tượng chung là rất hiệu quà Thí dụ, dự báo tới 95% các video có mục tiêu chính là quav người hay nhóm người Nó hữu ích cho các hệ thống để nhận biết và diễn giải con người Hiện tại, tiến trình nhận đạng và diễn giải được thực hiện bán tự động
Việc truy vấn trên cơ sờ hai loại đặc trưng nội dung mức thấp và mức cao gọi
là truy vấn trên cơ sở nội dung Một hệ thống cẩn sử dụng toàn bộ bốn mức đặc trưng sao cho hỗ trợ được các câu truy vấn mềm dẻo của người sừ dụng Các kỹ thuật này hỗ trợ nhau để hinh thành mô tả đầy đù về đối'tượng Thí dụ, mô tả văn bản tốt cho việc thu thập các khái niệm trừu tượng như cảm giác (vui, buồn ) nhưng không có khả năng mô tả mẫu dữ liệu đầy đù về các hình dạng không đều hay kết cấu M ặt khác, các dặc trưng nội dung mức thấp có thể thu thập các mẫu dữ liệu này nhưng không mô tà được các khái niệm trừu tượng
Khi đối tượng đa phương tiện có nhiều kiểu d ừ liệu đa phương tiện, các quan
hệ và tương tác giữa các loại dữ liệu này phài được sử dụng để trích chọn đặc trưng,
Trang 26Chú ý rằng, MPEG-7 chuẩn hóa các mô tà đặc trưng Tuy nhiên nó không chì ra các đặc trưng này được trích chọn như thế nào.
C h ỉ số hóa trong C S D L Đ P T p h ải là phân cấp và nhiều m ức:
> Mức cao nhất là phân lóp ứne dụng
> Mức chỉ số hóa thứ hai hình thành trên các mức đặc trưng khác nhau như
đã nói trên đày Các đặc trưng khác nhau cẩn chỉ số hóa khác nhau
> Mức thứ ba hình thành trên quan hệ không gian và thòi gian giữa các đối tượng
1.2.4.3 Đo tính tương tự
Truy vấn đa phương tiện trên cơ sở tính tương tự thay cho đối sánh chính xác giữa các dữ liệu cần truy vấn và các dữ liệu trong CSDL Tính tương tụ được tính toán trên cơ sở các đặc trưng, thuộc tính trích chọn và dưới dạng một hay nhiều giá trị Tuy nhiên, tương quan của kết quả truy vấn vẫn do con người quyết định Các kiểu đặc trưng được sử dụng để mô tả các đối tượng đóng vai trò quan trọng để phù hợp với yêu cầu này Thước đo tính tương tự rất phức tạp vì quyết định cùa người
sử dụng là chủ quan và phụ thuộc ngữ cảnh
Trang 271.2.5 Đ ảm b ả o c h ấ t lư ợ n g d ịc h v ụ (Q o S ) tr o n g c lie n t, s e r v e r và hệ th ố n g
tr u y ề n tin
CSDLĐPT thông thường là phân tán Các dối tượny đa phưcmg tiện được truy tim từ server và truyền đến client để trình diễn Dữ liệu đa phương tiện đòi hòi bảng thông rộng, không gian lưu trữ lớn và tốc độ đường truyền cao, giới hạn, thời gian trễ và đồng bộ không gian, thời gian Các media và ứng đụng khác nhau có các đòi hòi khác nhau Các đòi hỏi này phải thỏa mãn cho toàn bộ phiên trình điễn và truyền tin trong toàn bộ hệ thống
Để cung cấp khung làm việc đồnc nhất để chỉ ra và đảm bâo vêu cầu khác nhau này, QoS được đề xuất ỌoS là tập các tham số yêu cầu Là hợp đồng giao kèo giữa úng dụng đa phương tiện và hệ thống Khi ứng dụng có nhu cầu khởi động phiên làm việc, nó đệ trình yêu cầu QoS lèn hệ thống Hệ thống có thể sẽ không chấp nhận yêu cầu, có thể đàm phán các yêu cầu ứng dụng thấp hơn Khi hệ thống chấp nhận yêu cầu, hợp đồng giữa hệ thống và ứng dụng đứợc ký và hệ thống phải cung cấp QoS đòi hòi Đàm bảo nảy dưới hỉnh thúc cùa 1 trong 3 dạng sau:
> Đảm bào tiền định (hard - deterministic): Luôn thỏa mãn yêu cầu QoS
> Đảm bảo thống kê (soft - statistical): Đảm bảo dịch vụ được cung cấp với xác suất xác định p
> Đảm bảo nỗ lực (effort): Không đảm bảo QoS ứ n g dụng thực hiện ỉâu tùy
ý Là chiến lược phân chia hệ thống truyền thống
Một hệ thống đa phương tiện điến hình bao gồm ba thành phần chính: hosts (bao gồm cả clients và servers) dưới sự điều khiển cùa ọs, bộ quàn ỉý lưu trừ, hệ thổng truyền tin và giao vận
QoS được đảm bảo khi các tài nguyên hệ thống được quàn lý đúng đắn Các tài nguyên hệ thống bao gồm chu kỳ CPƯ, bộ nhớ, băng thông, v.v Mồi thành phần
hệ thống phải có bộ quản lý tài nguyên, nó điều phối việc sử dụng tài nguyên
Vấn đề nghiên cứu QoS còn khá mới mè Nhiều nhiệm vụ nghiên cứu được đặt ra, thí đụ làm thế nào để chuyển đồi các tham số QoS sang các yêu cầu tài
Trang 28nsuycn và phàn chia các phicn làm việc như the nào đẻ nhiều phiên làm việc dcu dược dáp ứng bời số lượng cố định tài nguyên.
1.2.6 C á c n h iệ m v ụ k h á c
1.2.6.1 Nén dữ liệu đa phương tiện
Mục tiêu chinh cùa nén dữ liệu đa phương tiện là khả năng nén nhiều nhất có thề không quan tâm đến khía cạnh trình diễn và tìm kiếm Phần lớn các tệp âm (hanh, ành và video được nén nhờ kỹ thuật hay theo chuẩn nhất định Để trích chọn đặc trưng của các file này thì trước hết phải giải nén chúng đã Quan điềm này không hiệu quả về mặt tính toán vi nén và giải nén phải thực hiện vài lần trong tiến trình trích chọn, không hiệu quả khi lưu trữ vì các tệp nén và các đặc trưng trích chọn được lưu trừ tách biệt Do vậy, cần có kỹ thuật nén sao cho trích chọn đặc trưng thực hiện trực tiếp trong dừ liệu nén và trong đó nén trên cơ sở đối tượng, không trên cơ sờ các giá trị mẫu riêng rẽ Có thể thực hiện chỉ số hóa và truy tìm ảnh trong dữ liệu nén DCT, lượng tử vẻctơ, v.v Nếu có thề chuyển ảnh bitmap sang
đồ họa véctơ thì đạt được tỷ lệ nén cao hơn và dễ dàng truy vấn hơn MPEG-4 và JPEG2000 là thí dụ về các chuẩn tổ hợp nén và truy vẩn
Khía cạnh khác của nén là phải phù hợp với truyền tin và trình diễn Trong nhiều ứng dụng, ảnh thumbnail được hiển thị trước trong màn hình hay cửa sổ để người đùng iựa chọn Nếu người dùng quan tâm ánh nào thì họ chọn ảnh và phiên bàn mật độ lớn hơn để hiển thị Có thể thực hiện ứng dụng loại này theo hai cách sau:
> Phưomg pháp thứ nhất: Ảnh kích thước khác nhau suy diễn từ cùng một ảnh được tạo ra, nén, lưu trữ riêng rẽ trong server Các ảnh có kích thước yêu cầu sẽ gửi đến client để hiển thị Thi dụ, dữ liệu ảnh thumbnail được truyền để hiển thị, dữ liệu ảnh gốc được gửi ừình tự theo yêu cầu
> Phương pháp thứ hai: Các ảnh được nén và lưu trữ theo kích thước ban đầu Dựa vào yêu cầu, dữ liệu ảnh gốc được truyền đến client không quan tâm đến yêu cầu của client Trong phần lớn các trường hợp, client làm
Trang 29giảm dữ liệu ãnh truyền ihành kích thước nhò hơn để hiến thị Nếu user muốn quan sát toàn bộ ảnh gốc thì ảnh gốc được truyền đi.
Cả hai phương pháp đều không hiệu quả từ góc độ không gian lưu trữ và băng thông Để giải quyết vấn đề trên, cẩn sử dụng kỹ thuật nén phản cấp như JPEG
và MPEG-4 Nó không chỉ tiết kiệm không gian lưu trữ và băng thông mạng mà còn lảm giảm thời gian đáp ứng vì ảnh được truyền, giải mã, hiền thị một cách tiến triền dần dần thay cho giải mã và hiển thị chi khi dữ liệu đã sẵn sàng
1.2.6.2 Chuẩn hóa biểu diễn dữ liệu
Trong tiến trình trích chọn đặc trưng và nén, đã giả sử rằng các giá trị mẫu thô cho mỗi media cỏ được theo cùng cách và có cùng ý nghĩa Trong thực tế già sử này là không thực Thí dụ, các đoạn âm thanh được ghi ờ các cường độ khác nhau,
vì vậy việc so sánh trực tiếp các giá trị mẫu từ các đoạn âm thanh khác nhau là vô nghĩa Tương tự, các giá trị pixel ành từ các ảnh khác nhau có thể có ý nghĩa khác nhau vì sử dụng các giả trị gama hiệu chinh khác nhau và hệ thống màu khác nhau
Do vậy, các thông tin ảnh hưởng giá trị mẫu cần gộp vào header tệp và các giá trị mẫu được hiệu chinh tùy theo trích chọn đặc trưng Ngày nay, các khuôn mầu âm thanh và ảnh không bao gồm thông tin nảy c ầ n có trình diền chuẩn cho mỗi medium
Trang 30Phần trình bày trong chương sẽ nêu khái quát đặc điểm của các mô hình cơ sở dữ liệu chính là quan hệ, hưcmg đối tượng và đối tượng quan hệ làm nền tảng cho sự lựa chọn mô hinh dữ liệu cho CSDLĐPT [1][3][4][5] Đồng thời trình bày khả năng quàn lý
và đáp ứng các yêu cầu ứng dụng đa phương tiện dựa trên mô hình dữ liệu đối tượng quan hệ của hai HQTCSDL nổi bật là Oracle và DB2 [8]
2 1 M ô h ì n h c ơ s ở d ữ l i ệ u q u a n h ệ
Cơ sờ dừ liệu quan hệ (Relational database - RDB) ỉà một cơ sở dừ liệu m à dữ liệu được lưu thành các bảng dưới dạng các hàng và cột dữ liệu Mỗi bảng được định nghĩa dựa trên các kiểu dữ liệu đã được cung cấp sẵn và được chi định khóa Các bảng trong cơ sờ dữ liệu có thể thiết lập quan hệ với nhau tạo nên sự ràng buộc chặt chẽ về mặt dữ liệu cũng như cấu trúc để đảm bảo tối ưu cho cơ sở dữ liệu, tránh dư thừa thông tin Mỗi cột dữ liệu (trưởng hay thuộc tính) đều được xác định kiểu giá trị và với mỗi hàng, mỗi cột chỉ chứa một kiểu giá trị duy nhất
M ột cơ sở dừ liệu quan hệ thường gồm một sổ thành phần như sau:
> B ả n g : nơi chứa dừ liệu cùa người dùng.
Trang 31-
29-> Ràng buộc, quan hệ: thiết lập quan hệ giũa các bàng dừ liệu với nhau
> Khung nhìn (View) / Câu hỏi (Query): cho phép quan sát dữ liệu được lấy từ nhiều bàng dữ liệu khác nhau, được xảy dựng dựa trên tập lệnh SQL
'r- Thủ tục / hàm: bao gồm hai loại: Store Procedure và Trigger Cho phép lấy dữ liệu từ các bảng hoặc tự động cập nhật cơ sờ dữ liệu khi có một sự thay đổi nào
đó Việc sừ dụng các hàm/thù tục trong cơ sỡ dữ liệu quan hệ (do hệ quàn trị cơ
sở dữ liệu quản lý và thực thi) giúp cho các thao tác trên đừ liệu thực hiện nhanh hơn
Ngoài ra, đối với mỗi hệ quản trị cơ sở dữ liệu quan hệ khác nhau có thể hỗ trợ thêm các chức năng khác nhau cho người sử dụng cơ sờ dữ liệu như:
> Lập chi mục: cho phép người xây dựng cơ sờ dù liệu lập chì mục dựa trẽn một
sổ trường dữ liệu nào đó, phục vụ cho việc tim kiếm dữ liệu, khai thác dữ liệu thực hiện nhanh hơn
> Quàn lý nọicời dùng: quàn lý và phân quyền người sử dụng cơ sờ dừ liệu Với mỗi người dùng riêng biệt sẽ được phép can thiệp vào một phần hoặc toàn bộ cơ
sở dữ liệu
Thông thường một cơ sở dữ liệu quan hệ cũng hỗ trợ việc lưu trữ các dữ liệu đa phương tiện ở dạng BLOB (Binary large object) Tuy nhiên, cơ sở dừ liệu quan hệ không
hồ trợ các thao tác với nội đung cùa các dữ liệu đó
M ột số hệ quản trị cơ sở dữ liệu quan hệ phổ biến: M icrosoft Access, M icrosoft SQL Server, M yS Q L
2 2 M ô h ì n h C O ' s ở d ữ l i ệ u h ư ớ n g đ ố i t ư ợ n g
Cơ sờ dữ liệu hướng đối tượng (Object Oriented Database - OODB) hay còn gọi
là cơ sở dữ liệu đối tượng (Object Database - ODB) là cơ sờ dữ liệu cho phép tạo, điều khiển và lưu trừ các đổi tượng theo cách thức dễ hiểu và liên tục OODB lun toàn bộ thông tin mô tã về đối tượng (thông tin ihuộc tính) và lược đồ của đổi tượng (cấu trúc của
Trang 32đữ liệu hướng đối tượng, các kiểu dữ liệu có thể là các đối tượng cơ sở.
Hiện nay chưa có 1 chuẩn rộng rãi về O O D B, các sản phẩm của OODB vẫn còn khá hạn chế và đang trong giai đoạn sơ khai Trong thời gian này, cơ sở dữ liệu đổi tượng quan hệ (O RD B) ra đời dựa trên sự bổ sung thêm các tính năng vào RDB Một hệ quản trị cơ sở dữ liệu hướng đối tượng bao gồm 2 tiêu chuẩn sau:
> Là một hệ quản trị cơ sỡ dữ liệu;
> Là một hệ thống hướng đối tượng
Mỗi kiểu đổi tượng của OODB có m ột chì danh xác định đối tượng OID Tuy nhiên, để xác định đối tượng trong cơ sở dữ liệu người dùng cỏ thể định nghĩa khóa (là một tập con các thuộc tính)
M ột đối tượng trong OODB thường gồm ba thành phần:
> OID: chỉ danh xác định đối tượng íà duy nhất
> Khởi tạo: cung cấp hàm khời tạo đối tượng từ các đối tượng dữ liệu khác
> Giá trị: bao gồm giá trị của đối tượng
OODB sử dụng OSQL để thao tác trên các đối tượng dữ liệu
M ột số hệ quản trị cơ sở dữ liệu đổi tượng quan hệ: O2, Ozone,
O bjectivity/D B :O bjectStore,PSE/Pro,
Trang 33Dơ c ơ sờ dữ liệu đối tượng quan hệ lưu trũ dữ liệu trong các bảng như một cơ sở
dữ liệu quan hệ truyền thống, tức là tất cả dữ liệu tại một cột nào đó của bảng phải cùng kiểu, vi vậy khỏng cỏ sự khác biệt giữa dữ liệu là đối tượng và phi đối tượng Bản thân các kiểu dữ liệu cùa cơ sở dữ liệu đối tượng quan hệ không phải là các đối tượng Các đối tưọ-ng được xây đựng từ nhừng kiểu dữ liệu cơ bản
Ràng buộc về tỉnh thực thi: do cơ sờ dữ liệu đổi tượng quan hệ chuyền đổi dữ liệu giữa định dạng đối tượng thành định dạng của cơ sờ dữ liệu quan hệ nên tốc độ thực hiện của cơ sở dữ liệu sẽ giảm theo kích cỡ của đối tượng và độ lớn của cơ sờ dữ liệu Tuy nhiên, mô hình cơ sở dữ liệu đối tượng quan hệ rất thích hợp với những hệ thống cơ
Các đặc trirng của ORDBMS. ngoài các đặc trưng cùa RDB, ORDB có thêm một
số đặc trưng mới phục vụ cho các kiếu đối tượng, đó là:
> Các đối tượng dừ liệu phức tạp: người xây dựng cơ sở dữ liệu có thể tạo ra các
Trang 3432
-kiểu dữ liệu mới là các lớp, các đổi tượng để lưu trũ các đối tượng dữ liệu phức tạp dựa trên các kiểu dừ liệu đã có Mỗi đối tượng lưu trong cơ sờ đữ liệu có một định đanh đổi tượng (O ID ) độc lập vời các dữ liệu thuộc tính của đối tượng
> Phương thức: là các hàm, các thù tục gắn với lớp đối tượng Các phương thức này làm việc ũrơng tự như các hàm của SQL truyền thống, vi vậy chúng ta có thể sử dụng trong các query và trong việc định nghĩa các kiểu dừ liệu mới
> Tinh thừa ké: một đổi tượng có thể thừa kế toàn bộ hoặc một phần dữ liệu và các phương thức cùa các đối tượng khác
> Hỗ trợ đa thừa kể: một đối tượng có thể thừa kế từ nhiều đối tượng khác nhau
M ột sổ hệ quàn trị cơ sở dữ liệu đối tượng quan hệ: Oracle, IBM DB2, In fo rm ix
2 4 M ô h ì n h q u a n h ệ m ở r ộ n g ừ o n g O r a c l e I n t e r M e d i a
Oracle là một hệ quản trị cơ sở dữ liệu đối tượng quan hệ Điều này có nghĩa là ngoài vai trò của một hệ quản trị cơ sở dữ liệu truyền thống là quản lý an toàn và hiệu quả dừ liệu quan hệ, Oracle còn có khả năng định nghĩa các kiểu đối tượng gồm dữ liệu két hợp với các đối tượng và các phương thức của chúng thông qua một đặc trưng nổi bật được tích hợp vào Oracle là Oracle InterMedia Oracle InterM edia m ở rộng độ tin cậy, tinh sằn sàng và khả năng quản lý các dạng dữ liệu đa phương tiện trong các ứng dụng truyền thống, trên Internet, trong thương mại điện tử thậm chí cà trong các ửng dụng giàu
dữ liệu đa phương tiện
Trang 35Các nội dum’ được trình bày trong phần này thể hiện khả nâng quàn lý cùa Oracle Inter Medio gồm:
'r Q uản lý nội đung đa phương tiện;
> Các kiểu đối tượng ành ORDImage, audio ORDAudio, video ORDVideo: cung cấp các khái niệm về ảnh, audio, video và việc sừ dụng các kiểu đối tượng ORDImage, ORDAudio và ORDViđeo để xây đựng các ứng dụng ành, audio, video
> Lưu trữ dừ liệu đa phương tiện;
> N ạp dữ liệu đa phương tiện;
> Truy cập dữ liệu đa phương tiện;
> Truy vấn dữ liệu ành dựa trên nội dung;
> Kiến trúc của Oracle ĩnterMedia;
> V à khả năng mờ rộng cùa Oracle InterMedia
2.4.1 Q u ả n lý n ộ i d u n g đa p h ư ơ n g tiện
C ác kiểu đối tư ọ n g đ a phưrm g tiện
O racle InterM edia cho phép quản lý dữ liệu đa phương tiện thông qua một tập hợp các kiểu đổi tượng ORDImage, ORDAudio, and ORDVideo tương ứng với các dữ liệuimage, audio và video Các kiểu đối tượng này tương tự như các lớp trong Java hoặc c++
gồm có các thuộc tính, siêu đừ liệu, nội dung dữ liệu đa phương tiện và cả các phương thức
> Nội dung dừ liệu là những dữ liệu thực liên quan đến từng loại dữ liệu image, audio, video hoặc dạng hồn hợp
> Siêu d ữ liệu là thông tin định dạng về nội dung dữ liệu bao gồm các thông tin như độ dài của đổi tượng, có định dạng nén hay không hoặc các thông tin khác được cung cấp từ chương trình ứng dụng như tên cùa một ca sỹ cho một bài hát
kỹ thuật số nào đó v.v
> Các phương thức là các thủ tục có thể thực thi trên đối tượng như lưu trừ, phân
Trang 36phối hoặc trích siêu dữ liệu, hoặc nén hoặc chuyển đồi định dạng dừ liệu (ví dụ như chuyển đổi định dạng ảnh).
Ngoài ra, Oracle InterM edia còn có kiểu đổi tượng ORDDoc Kiểu đối tượng này
cỏ thể chứa hồn hợp các đổi tượng ORDImage, ORDAudio hoặc ORDVideo Vì vậy, với kiểu đổi ĩượng ORDDoc vấn đề về quàn lý sẽ phức tạp hơn với các đối tượng khác
Trong quá trình sử dụng, các kiểu đối tượng này có thể được m ờ rộng để hồ trợ cho các ứng dụng phức tạp khác như:
> Bổ sung thêm các định dạng phức tạp;
> Luợc đồ nén và giải nén mới;
> Chi mục chuyên biệt;
> T ự tạo các truy vấn tối ưu và các phương thức;
> Các nguồn đữ liệu mới;
> Các giải thuật xừ lý dữ liệu chuyên dụng
Việc thêm một hoặc nhiều cột đa phương tiện (ORĐImage, ORDAudio, and ORD V ideo) vào trong các bảng đã có (hình 2.1) hoặc tạo ra bảng mới có các cột đữ liệu
đa phương tiện có thể thực hiện đơn giản Điều này thể hiện khả năng quản ỉỷ kết hợp dữ liệu đa phương tiện và quan hệ
H ình 2.1: C ác đối tư ợ n g đa p h ư ơ n g tiện tro n g các cột của b ản g q u an hệ
Trang 37M ô h ìn h lưu tr ữ các đối tư ợ n g đ a p h ư ơ n g tiện
Việc lưu trữ dữ liệu đa phương tiện trong Oracle có nhiều sự lựa chọn như:
> Lưu trữ ở dạng BLOBs (Binary large objects) trong CSDL;
> Hoặc lưu trữ ờ dạng BFILEs (File - based large objects) ờ một vị trí xác định trong hệ thống file đặc tnm g cùa hệ điều hành;
> URLs (Uniform Resource Locator) chứa dữ liệu image, audio và video trên một HTTP server đó nào ví dụ như Oracle Application Server hoặc Oracle Database, Netscape Application Server, M icrosoft Internet Information Server (IIS), Apache HTTPD Server và Spyglass Servers
> Các Server chuyên dụng dùng để lưu trừ đừ liệu đa phương tiện
K hả năng nhập xuất đ ữ liệu giừa CSDL Oracle với các nguồn dữ liệu khác cũng
có thể thực hiện dễ đàng Cách lưu trữ dữ liệu đa phương tiện bên ngoài CSDL cung cấp một kỹ thuật thuận tiện cho việc quản lý dữ liệu đa phương tiện, vì các dữ liệu này được ỉưu trữ tập trung, thao tác nhập hoặc xuất dừ liệu ờ dạng BLÓBs và nguồn BFILEs bên ngoài có thể thực hiện tại mọi thời điểm
Các đối tượng của Oracle InterM eđia (ORDAudio, ORDImage, ORDVideo, and
O R D D oc) có chung một mô hình lưu (rữ dữ liệu Thành phần dữ liệu đa phương tiện cùa các đối tượng này được lưu trữ trong c a sờ dữ liệu dưới dạng BLOBs có sự kiểm soát giao dịch hoặc bên ngoài cơ sờ dữ liệu và không có sự kiếm soát giao dịch Cách thức
Trang 3836
-lưu trữ dừ liệu bèn ngoài có thể sử dụng BFILEs (tệp phảng cùa hệ diều hành), qua các URL của HTTP server, hoặc trên một Server dữ liệu đa phưong tiện chuyên biệt, hoặc từ nguồn đ ữ liệu do nsỊirời dùng định nghĩa trên các Server khác
Siêu dữ liệu và các phương thức cùa đổi tượng luôn được lưu trữ trong CSDL dưới sự kiểm soát của O racle InterM edia D ù nội dung dữ liệu đa phươntỉ tiện được ỉưu trử ở trong hay ngoài CSDL, Oracle InterM eđia vẫn sẽ quản lý tấ t cả các kiểu đối tuợne
đa phương tiện và tự đ ộ n s trích siêu dữ liệu cho từng kiểu đổi tượng Siêu d ữ liệu bao gồm:
> Thông tin về audio, video, image và các dạng d ữ liệu hỗn hợp khác gồm nguồn gốc, vị trí, tên nguồn, v.v
> Cập nhật thông tin có liên quan đến định dạng dữ ỉiệu và thời gian sửa đổi;
> Kiểu dừ liệu đa phương tiện M IM E (sử dụng trong các ứng dụng W eb và mail);
> Độ rộng, cao của ảnh, độ lớn nội dung ảnh, định dạng ảnh hoặc kiểu nén ảnh;
> Kiểu mã hóa audio, số lượng kênh, tốc độ lấy mẫu, kích thước mẫu, kiều nén, thời gian thực hiện và phần mô tả;
> Độ cao, rộng cùa frame video, tốc độ và độ phân giải của frame, thời gian thực hiện, số lượng fram es, kiểu nén, số lượng m àu, sổ lượng bits và phần mô tả;
> Sự lựa chọn siêu dừ liệu cho ứng đụng (ví dụ như tên ca sỹ hoặc tên hãng phim);
> Siêu dừ liệu của các dạng dữ liệu trong XM L
V ới các dạng d ữ liệu đa phương tiện, siêu d ữ liệu thường gắn liền với các đặc điểm của kiểu dữ liệu đó như:
> Các đặc điểm cùa Im age: độ cao, độ rộng và độ dài nội dung ảnh, định dạng ảnh
vả các định dạng nén ảnh
> Các đặc điểm của Audio: kiểu mã hóa, số kênh (rãnh), tốc độ lấy mẫu, kich thước mẫu, kiểu nén và thời gian thực hiện (khoảng thời gian)
Trang 39> Các đặc điểm cùa Video: độ cao và độ rộng cùa frame, độ phân giãi của frame, tốc độ, thời 2,ian thực hiện (khoảng thời gian), số frames, kiểu nén, số màu, và tỷ
lệ bits
Các phương thức trích siêu dừ liệu thường là một tập các phương thức thao tác trên dữ liệu cụ thể Ví dụ đối với images, có thể thực hiện việc chuyền đối định đạng, nén xác định tỷ lệ xích, cất xén, sao chép, chiếu, quay và điều chình tỷ lệ sáng cùa ảnhv.v
N hư vậy, Oracle InterM edia hồ trợ lưu trữ các định dạng file phổ biến như các dạng image, và các định dạng chuỗi audio, video trong cơ sờ dữ liệu Các thao tác thêm (add) các cột hoặc các đối tượng đa phương tiện vào các bảng dữ liệu đã có, hoặc chèn (insert) hoặc truy vấn (retrieve) dữ liệu đa phưcmg tiện cũng được hỗ trợ Điều này cho phép các nhà thiết kế cơ sờ dữ liệu có thể mở rộng các cơ sở dữ liệu đã có với dữ liệu đa phương tiện, hoặc có thể xây đựng mới các ứng dụng cơ sờ dữ liệu đa phương tiện cho người sử dụng Các chưyên gia phát triền Oracle ỉnterMedia có thể sử dụng các chức năng cơ sờ sẵn có để xây đựng các ứng đụng đa phương tiện chuyên dụng
Trong khi xây dựng các ứng dụng, các nhà phát triển ứng dụng nhận thấy vai trò
và lọi ích cùa Oracle InterM edia cùng với các dịch vụ tích hợp khác nhir Jdeveloper giúp cho môi trường phát triền các ứng dụng và vấn đề quản lý dữ liệu trên Oracle trở nên thuận lợi hơn
G iao diện dổi tư ợ n g q u a n hệ
Trước đây các ứng dụng thường lưu trữ dữ liệu đa phứcmg tiện ở dạng BLOBs hon là sử dụng các đối tượng của Oracle InterM edia Hiện nay, các ứng dụng có thê sử dụng các đặc điểm cùa Oracle InterM edia thông qua çiao diện đối tượng quan hệ cùa Oracle InterM edia làm Oracle InterM edia trở nên gần gũi hơn
Trang 40C ác th à n h p h ầ n của ảnh
Các ảnh số chứa dữ liệu ảnh (dưới dạng các bit) và các thuộc tính mô tả các đặc điểm của ành Các thuộc tính tối thiều của một ảnh bao gồm:
> Kích thước ảnh (độ cao trên từng dòng quét ảnh và độ rộng tính theo pixels);
> Sổ lượng bits/1 pixels trong từng mẫu mầu của ành;
> Kiểu nén;
> Đ ịnh dạng nội dung ảnh bao gồm có các dạng:
• Ảnh một màu hoặc độ sâu của bit (M onochrome or bit depth);
• Mô hình mẫu (Band Interleaved by Plane, Band Interleaved by Line, BandSequential);
• Mô hình màu (Lookup Table, Direct), không gian màu (GRAY, RGB);
• Các thuộc tính riêng
G ắn kèm với ảnh đôi khi còn có các thông tin riêng như tên của người được chụp,
mô tà ảnh, ngày chụp, người chụp, v.v Do vậy, dữ liệu ảnh được lưu trừ cùng với dừ liệu text mô tả ảnh nằm ở một cột hay thuộc tinh trên bàng cơ sờ dừ liệu