1.2 Các đặc tính chung của dữ liệu multimedia • Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu trúc vì vậy các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm
Trang 1MULTIMEDIA DATABASE
I, BÀI TOÁN
Xây dựng chương trình chia sẻ thông tin với bạn bè Chúng ta biết rằng thông tin chia sẻ ở đây là bao gồm những thước phim, những hình ảnh, hay đơn giản là những câu chuyện bạn cảm thấy thú vị, Để làm được điều này ta cần một loại cơ sở dữ liệu đáp ứng được việc lưu dữ liệu với kích thước lớn và
có đầy đủ tính năng của cơ sở liệu thông thường Như cho phép tìm kiếm thông qua cá dặc trưng riêng Và đó chính là cơ sở dữ liệu đa phương tiện (Multimedia Database)
II CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
CHƯƠNG I : GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
1.1 Dữ liệu đa phương tiện:
Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu không liên tục Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay đổi theo thời gian Các dữ liệu không liên tục là các dữ liệu không phục thuộc vào thời gian, các loại dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản (có hoặc không có định dạng), hình ảnh tĩnh và các đối tượng đồ họa Các kiểu
dữ liệu thông thường của một CSDL multimedia bao gồm:
• Dữ liệu văn bản (có hoặc không có định dạng)
• Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp postscript
• Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức chuẩn
Trang 2như là JPEG hoặc MPEG.
• Các hoạt hình
• Âm thanh
• Video
1.2 Các đặc tính chung của dữ liệu multimedia
• Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu trúc vì vậy các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm nội dung, truy vấn dữ liệu thường là không áp dụng được
• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm thanh và hoạt hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu trữ, thao tác và mô tả chúng
• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi các thiết bị lưu trữ lớn
• Các ứng dụng hỗ trợ: các dữ liệu phi chuần có thể đòi hỏi các quy trình
xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các ứng dụng CSDL multimedia
1.3 Phương pháp cơ bản truy vấn dữ liệu
Dữ liệu quản lý có tính lịch sử và có rất nhiều phương pháp để được đưa
ra để quản lý và truy vấn các loại dữ liệu khác nhau ttrong hệ thống máy tính Phương pháp tiếp cận cơ bản đang được sử dụng cho quản lý dữ liệu có thể được phân loại như sau loại:
• Hệ thống cơ sở dữ liệu thông thường: Đây là phương pháp được sử dụng
rộng rãi trong quản lý và tìm kiếm dữ liệu có cấu trúc Tất cả dữ liệu trong một
hệ thống cơ sở dữ liệu phù hợp với một số cấu trúc được xác định trước và hạn chế Để xây dựng một truy vấn cơ sở dữ liệu người sử dụng phải xác định đối tượng dữ liệu được lấy ra, các bảng cơ sở dữ liệu mà từ đó họ có thể được trích xuất và thành phần truy vấn phụ thuộc vào Một ngôn ngữ truy vấn cơ sở
Trang 3dữ liệu nói chung là các loại nhân tạo, một trong những hạn chế với cú pháp và
từ vựng, chẳng hạn như SQL
• Hệ thống truy vấn thông tin (IR- Information retrieval): IR hệ thống được sử
dụng chủ yếu để tìm kiếm các bộ sưu tập văn bản lớn, trong đó nội dung của
dữ liệu (văn bản) được mô tả bởi một chỉ mục bằng cách sử dụng từ khoá hoặc trừu tượng thành văn bản, và từ khóa hoặc ngôn ngữ tự nhiên được sử dụng
để thể hiện nhu cầu truy vấn Ví dụ cho một hình ảnh hoặc video, chúng tôi có
để mô tả nó trong các từ hoặc một cách để lưu trữ rất nhiều siêu dữ liệu (dạng văn bản)
• Truy hồi dựa trên nội dung (CBR): phương pháp tiếp cận hệ thống này
được sử dụng để lấy mong muốn các đối tượng đa phương tiện từ một bộ sưu tập lớn trên cơ sở tính năng (như kết cấu, màu sắc và hình dạng, vv) có thể được tự động chiết xuất từ bản thân các đối tượng Mặc dù từ khoá có thể được coi như một "Tính năng" cho dữ liệu văn bản, thu hồi thông tin truyền thống có nhiều hơn nữa cao hơn hiệu suất thu hồi hơn so với nội dung dựa trên bởi vì từ khóa có khả năng đã được chứng minh đại diện ngữ nghĩa, trong khi không có tính năng hiển thị thuyết phục ngữ nghĩa mô tả khả năng Nhưng nhược điểm chính của phương pháp này là nó thiếu chính xác
• Đồ thị hoặc cây mô hình phù hợp: Cách tiếp cận này nhằm mục đích để lấy
đối tượng phụ đồ thị từ một đối tượng đồ thị theo một số mô hình ký hiệu
1.4 Các DBMS và vai trò của chúng trong việc xử lý dữ liệu multimedia
Các DBMS ngày nay được xây dựng khá tốt và được sử dụng rộng rãi đối với
dữ liệu có cấu trúc Các DBMS trội nhất là các hệ quản trị dữ liệu quan hệ (RDBMS) Trong RDBMS, thông tin dược tổ chức thành bảng hoặc các quan
hệ Các dòng của bảng tương ứng với các khoản mục thông tin hoặc các record, trong khi đó các cột tương ứng với các thuộc tính Ngôn ngữ truy vấn có cấu trúc (SQL) được sử dụng để tạo ra các bảng như thế và để chèn và truy
Trang 4xuất thông tin từ các bảng đó
Chúng ta dùng một ví dụ đơn giản dể minh hoạ cách sử dụng SQL để tạo lập một bảng và chèn, truy xuất thông tin từ đó Giả sử chúng ta muốn lập một bảng chứa các bản ghi về sinh viên bao gồm số hiệu sinh viên, tên và địa chỉ Ta có lệnh sau:
Create table STUDENT(
stu# integer, name char(20), address char(100));
Khi chúng ta muốn chèn các bản ghi về sinh viên vào bảng, chúng ta sử dụng lệnh chèn SQL như sau:
Insert into STUDENT values(10,"Lew, Tom","2 Main St.,
Churchill, australia");
Lệnh trên sẽ chèn một dòng vào bảng STUDENT
Thông tin trong bảng được truy xuất khi sử dụng câu lệnh SELECT của SQL
Ví dụ, nếu muốn truy xuất tên của sinh viên với sinh viên số 32, ta sử dụng lệnh truy vấn sau:
Để hỗ trợ cho các trường có giá trị lớn trong RDBMS, một khái niệm được gọi là
Trang 5đối tượng rộng hoặc nhị phân (BLOB) sẽ được giới thiệu Một BLOB là một xâu bit lớn các độ dài biến Ví dụ, nếu ta muốn lưu bức tranh của sinh viên trong bản ghi ở bảng STUDENT trên, chúng ta có thể tạo ra một bảng khi sử dụng lệnh sau:
Create table STUDENT(
Stu integer, Name char(20), address char(100), Picture BLOB);
Các BLOB bình thường chỉ là xâu bit và hoạt động bằng việc so sánh chứ không mang chúng ra ngoài Đó là vì RDBMS không biết nội dung hoặc ngữ nghĩa của một BLOB Tất cả BLOB hiểu như một khối dữ liệu
Một dạng khác của các DBMS là hệ thống quản trị CSDL hướng đối tượng
(OODBMS) Các OODBMS kết nối các khả năng của cơ sơ dữ liệu (như lưu trữ
và tìm kiếm) và các đặc trưng hướng đối tượng (tóm lược, sự thừa kế, tính đồng nhất đối tượng) Một phương pháp tiếp cận chung là kết nối các đặc điểm hướng đối tượng với cơ sở dữ liệu quan hệ Hệ thống đã được kết nối thì được gọi là một hệ thống cơ sở dữ liệu đối tượng quan hệ Trong một hệ thống như vậy, các đối tượng được xác định một cách thích hợp trong hướng đối tượng Trong đó mỗi đối tượng chứa các đặc tính hoặc thuộc tính và các phương pháp hoặc các hàm được sử dụng để chế tác ra các đặc tính khác Ví dụ, chúng ta có thể định nghĩa một loại ảnh sau:
Create type IMAGE(
Private Size integer, Resolution integer,
Trang 6Content float[ ], publlic
Điểm khác biệt chính giữa BLOB và các đối tượng là đối tượng thì được định rõ một cách thích đáng, bao gồm các đặc tính và cho phép chúng có tác dụng, trong khi đó thì BLOB thì không
Các khái niệm về các BLOB và các đối tượng là một bước gần với xử lý dữ liệumultimedia Nhưng các BLOB được sử dụng chỉ để lưu dữ liệu có khối lượng lớn Trong khi các đối tượng chứa vài thuộc tính đơn giản, nhiều chức năng hơn nên được phát triển để xử lý việc truy xuất multimedia dựa vào nội dung Một vài các khả năng được yêu cầu như sau:
• Các công cụ, tự động hoá hoặc bán tự động trích rút các nội dung và các đặctrưng trong dữ liệu multimedia ;
• Các cấu trúc chỉ số hoá đa chiều, để điều khiển các vector multimedia
• Các độ đo tương đồng, nhằm truy xuất multimedia thay vì kết nối một cáchchính xác
• Lưu trữ các hệ thống phụ, thiết kế lại nhằm đáp ứng các yêu cầu của băng tầncao với cỡ lớn, thoả mãn những đòi hỏi theo kiểu thời gian thực
Trang 7• Giao diện sử dụng, được thiết kế cho phép các câu hỏi đa dạng trong nhiều kiểu truyền thông đa dạng và cung cấp các trình diễn multimedia
CHƯƠNG 2 CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MULTIMEDIA
DATABASE)
Khi thiết kế một hệ thống CSDL multimedia mô tả các loại dữ liệu multimedia khác nhau, chúng ta bắt buộc phải đối diện với một số câu hỏi quan trọng được đặt ra về cách thức tổ chức hệ trống như:
• Việc tổ chức về mặt nội dung đối với dữ liệu của các loại dữ liệu multimedia
• Việc lưu trữ vật lý của các dữ liệu này trên các thiết bị lưu trữ như thế nào
Để trả lời cho các câu hỏi này, trước tiên chúng ta xem xét tới khía cạnh tổ chức nội dung
2.1 Kiến trúc cho việc tổ chức nội dung
Ở đây chúng ta xem xét tới 3 kiến trúc áp dụng cho việc tổ chức nội dung của một hệ thống CSDL multimedia
2.1.1 Nguyên lý tự trị
Nguyên lý này đề cập tới việc chúng ta nhóm tất cả các dữ liệu ảnh, dữ liệu video và tất cả các dữ liệu văn bản và chỉ số hóa chúng theo nguyên tắc tối đa hóa hiệu suất của tất cả các loại truy nhập đối với các loại dữ liệu mà chúng ta
dự định Nguyên lý này đảm bảo rằng với mỗi loại dữ liệu (ảnh, video, văn bản) chúng đều được tổ chức với một cách thức đặc trưng phù hợp với mỗi loại dữ liệu này
Trang 9Hình 2.2: Mô tả nguyên lý đồng nhất
2.1.3 Nguyên lý lai ghép
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình bầy
ở trên Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số (index) riêng của chúng, trong khi đó các kiểu dữ liệu khác sẽ sử dụng một chỉ
số (Index) “thống nhất”
Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các đặc tính khác nhau sẽ được nói đến ở phần sau
Trang 10Hình 2.3: Mô tả nguyên lý lai ghép
Cả ba loại nguyên lý trên đều có những ưu điểm và nhược điểm riêng của mình Kiến trúc dựa trên nguyên lý tự trị đòi hỏi việc tạo ra các thuật toán và cấu trúc dữ liệu của mỗi kiểu dữ liệu, ngoài ra nó cũng đòi hỏi các kỹ thuật hỗ trợ cho việc liên kết chéo giữa các cấu trúc dữ liệu khác nhau này Các công việc này đòi hỏi tính phức tạp cao và đòi hỏi một lượng thời gian lớn cho việc phát triển Bên cạnh các nhược điểm trên, việc xây dựng các cấu trúc được đặc biệt hóa tối ưu cho việc truy xuất dến từng loại dữ liệu khác nhau, CSDL multimedia được tổ chức theo nguyên lý này thường đem lại hiệu quả cao trong việc xử lý tìm kiếm Đối với các ngân hàng dữ liệu đã được xây dựng sẵn, nơi mà các thuật toán và các cấu trúc dữ liệu đã được sử dụng có hiệu quả thì việc áp dụng nguyên lý tự trị là mô hình kiến trúc thích hợp nhất Các kỹ thuật hướng đối tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương
Trang 11thức của nó có thể truy cập được từ một CSDL multimedia tổng thể.
Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi hỏi chúng ta phải tìm ra được một cấu trúc dữ liệu chung mà có thể dùng để lưu trữ các thông tin về nội dung của hình ảnh, video, văn bản, âm thanh và các loại dữ liệu khác Điều này đòi hỏi chúng ta phải phân tích nội dung của mỗi kiểu dữ liệu và tóm tắt được phần chung của chúng, qua đó xây dựng một bộ chỉ số dựa trên các yếu tố chung đã được xác định này Ưu điểm nổi bật của nguyên lý đồng nhất là dễ dàng triển khai và các thuật toán thường được thực hiện rất nhanh Nhược điểm chính của nguyên lý này là các sự chú giải phải được tạo ra theo một cách riêng nào đó, thường là được tạo ra một cách thủ công hoặc là tự động, việc tạo ra các chú giải một cách thủ công thường đỏi hòi nhiều về mặt thời gian cũng như chi phí, mặt khác trong quá trình tạo các chú giải này thường sẩy ra
sự mất mát thông tin nếu ngôn ngữ dùng để chú giải không trình bầy hết được các khía cạnh của nội dung Có thể đưa ra đây một số ví dụ như ngôn ngữ chú giải nội dung của hình ảnh có thể làm mất các thông tin về bề mặt của một điểm ảnh (pixel) hoặc một nhóm điểm ảnh Tương tự như vậy ngôn ngữ chú giải nội dung của âm thanh có thể làm mất các thông tin về biên độ, tần số của tín hiệu tại một thời điểm nào đó
Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời giảm thiểu được một số các nhược điểm của chúng Giả sử chúng ta muốn tạo ra một CSDL multimedia bao gồm các kiểu dữ liệu M1,…….,Mn, chúng ta bắt đầu bằng việc phân chia tập này thành 2 phần:
• Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu có sẵn, tồn tại sẵn các chỉ số và các thuật toán để thao tác với chỉ số Với việc bố trí này chúng ta đã tận dụng được lợi thế của các chỉ số và mã nguồn sẵn có
• Phần 2: bao gồm các dữ liệu không được kế thừa từ bất kỳ nguồn nào
và do đó không có sẵn các chỉ số của mình (điều này đồng nghĩa với việc
Trang 12là cũng không có bất kỳ thuật toán nào để có thể thao tác với tập chỉ số) Trong trường hợp này việc tiếp cận xây dựng hệ thống theo nguyên lý đồng nhất là cách thức thích hợp nhất ngay cả khi là cách tiếp cận này có thể nẩy sinh ra việc gây mất mát các thông tin vật lý chi tiết.
Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến hành việc xây dựng các thuật toán cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng việc sử dụng các tập chỉ sổ riêng của chúng Cách tiếp cận này giúp chúng ta thừa kế được tối đa các tài nguyên có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện thêm bởi vì các tệp chỉ số riêng có sẵn đối với mỗi loại dữ liệu đã được tận dụng Giả sử, một người dùng muốn đưa ra một câu hỏi “ Hãy tìm tất cả các hình ảnh và các đọan video mà trong đó ông chủ của đối tượng A
có mặt và trao đổi với đối tượng B” Câu hỏi này
bao gồm một sự kết hợp giữa các tệp chỉ số của các loại dữ liệu khác nhau, chúng sẽtruy cập đến CSDL hình ảnh (thông qua tệp chỉ số của dữ liệu hình ảnh), đến CSDL âm thanh (thông qua tệp chỉ số âm thanh) và đến một CSDL quan hệ (thông qua tệp chỉ số quan hệ), câu hỏi này có thể được diễn tả như sau:
SELECT Name, Image, Audio From Employee E, Image I, Audio A Where E.Name= “A” AND
I contains E.boss and
A contains E.boss AND
Trang 13vào ngày 10/01/1990.
• Đoạn video video1.mpg có hình ảnh của đối tượng A đưa cho đối tượng
B một chiếc vali (trong frames 50-100) Đoạn video này thu được từ sự theo dõi nhà của đối tượng B tại thành phố E thuộc nước F vào tháng 1- 1991
• Văn bản B.txt có chứa các thông tin chi tiết về dối tượng B được thu thập từ dữ liệu của cơ quan an ninh
Bản thân mỗi đối tượng trên cũng đã nói lên phần nào nội dung của từng đối tượng cụ thể (hình ảnh, video, văn bản), tuy nhiên thông tin đưa ra ở đây chỉ nói lên nội dung về mặt ngữ nghĩa hơn là đề cập đến các tính chất cụ thể của mỗi loại đối tượng, các tính chất loại này được gọi là các đặc trưng bậc thấp (lower-level) Một cách tiếp cận hiệu quả nhất đối với CSDL multimedia và đã được sử dụng rộng rãi trong thực tế là sử dụng các đối tượng được phát biểu ở trên như
là siêu dữ liệu (metadata)
Theo trên, giả sử chúng ta có một tập các đối tượng media o1,… ,on chúng ta kết hợp một vài metadata md(o1) với mỗi đối tượng media o1 (định dạng chính xác của metadata này sẽ được trình bầy sau), tương tự như vậy các metadata kết hợp với các đối tượng media 01,….0n tương ứng sẽ là md(o1),……,md(on), Chúng ta sẽ tiến hành việc chỉ số hóa các metadata này với một cách thức nhằm cung cấp các phương thức triển khai hiệu quả đối với các yêu cầu truy cập từ phía người dùng
Có thể rõ ràng thấy rằng, sự thành công của phương pháp này phụ thuộc cơ bản vào việc chúng ta đảm bảo được rằng với mỗi đối tượng media 0i thì metadata tương ứng của nó md(oi) là cô đọng và phản ánh đúng chỉ những gì
mà người dùng yêu cầu
Với một số lượng tối thiểu các metadata được dùng rõ ràng là chúng ta sẽ dễ dàng hơn trong việc chỉ số hóa cũng như là thực hiện các thao tác khai thác dữ liệu, tuy nhiên bên cạnh đó nếu số lượng metadata sử dụng ít thì có thể người