• Các công cụ, tự động hoá hoặc bán tự động trích rút các nội dung và các đặc trưng trong dữ liệu multimedia ; • Các cấu trúc chỉ số hoá đa chiều, để điều khiển các • Giao diện sử dụng
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ KHOA CÔNG NGHỆ THÔNG TIN
TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU
MULTIMEDIA DATABASE
NGUYỄN THỊ HUỆ
LÊ CHÍ CHUNG GIẢNG VIÊN: TS NGUYỄN HÀ NAM
Hà Nội - 2012
Trang 2NỘI DUNG
BÀI TOÁN
GIỚI THIỆU DỮ LIỆU ĐA PHƯƠNG TIỆN
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
Trang 3BÀI TOÁN
Xây dựng chương trình quản lý thông tin chia sẻ
- Nội dung chia sẻ: hình ảnh, âm thanh, video, tài
liệu văn bản
- Tính năng chương trình: cho phép truy cập,
update, tim kiếm thông tin theo một só tiêu chí
nhất định
2/3
Trang 4GIỚI THIỆU
1 Thế nào là dữ liệu đa phương tiện
2 Các đặc trưng của dữ liệu đa phương tiện
3 Phương pháp cơ bản trong truy vấn
dữ liệu
4 Vai trò của hệ quản trị trong truy vấn dữ liệu
Trang 5DỮ LIỆU ĐA PHƯƠNG TIỆN
Dữ liệu đa phương tiện được chia làm hai loại dữ liệu liên tục và dữ liệu không liên tục
Dữ liệu liên tục la loại dữ liệu phụ thuộc theo thời gian vd : video, audio
Dữ liệu không liên tục là loại dưc liệu không phụ thuộc thời gian VD: hình ảnh, file văn bản, ảnh vẽ
Các loại dữ liệu đa phương tiện cơ bản:
Text : Các loại văn bản(Có cấu trúc – hoặc không )
Đồ họa : là các bản vẽ minh họa
Hình ảnh, Hoạt hình, video, audio
Trang 6• Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu
trúc vì vậy các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá,
tìm kiếm nội dung, truy vấn dữ liệu thường là không áp dụng được
• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm
thanh và hoạt hình đều phụ thuộc vào yếu tố thời gian liên quan
mật thiết đến việc lưu trữ, thao tác và mô tả chúng
• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi
các thiết bị lưu trữ lớn
• Các ứng dụng hỗ trợ: các dữ liệu phi chuần có thể đòi hỏi các quy
trình xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu
đối với các ứng dụng CSDL multimedia
CÁC ĐẶC TÍNH CHUNG
Trang 7- Hệ thống cơ sở dữ liệu thông thường: Đây là phương pháp
được sử dụng rộng rãi trong quản lý và tìm kiếm dữ liệu có cấu trúc.
- Hệ thống truy vấn thông tin (IR- Information retrieval): IR hệ
thống được sử dụng chủ yếu để tìm kiếm các bộ sưu tập văn bản lớn – dự liệu truy vấn là các từ khóa của văn bản.
- Truy hồi dựa trên nội dung (CBR):phương pháp tiếp cận hệ
thống này được sử dụng để lấy mong muốn các đối tượng đa
phương tiện từ một bộ sưu tập lớn trên cơ sở tính năng (như kết cấu, màu sắc và hình dạng, vv) có thể được tự động chiết
- Đồ thị hoặc cây mô hình phù hợp: Cách tiếp cận này nhằm
mục đích để lấy đối tượng phụ đồ thị từ một đối tượng đồ thị
theo một số mô hình ký hiệu.
PHƯƠNG PHÁP TRUY VẤN CƠ BẢN
Trang 8• Các công cụ, tự động hoá hoặc bán tự động trích rút các
nội dung và các đặc trưng trong dữ liệu multimedia ;
• Các cấu trúc chỉ số hoá đa chiều, để điều khiển các
• Giao diện sử dụng, được thiết kế cho phép các câu hỏi
đa dạng trong nhiều kiểu truyền thông đa dạng và cung cấp các trình diễn multimedia
VAI TRÒ CỦA DBMS
Trang 9VAI TRÒ CỦA DBMS
Cung cấp đối tượng lưu trữ dữ lương lớn(BLOG, CLOG )
VD:Trong DB2 trường BLOG có thể lưu trữ lên đến 4GB
Cách tạo một bảng dữ liệu chứa thông tin hình ảnh:
Create table STUDENT(
Stu integer,
Name char(20),
address char(100),
Picture BLOB);
Trang 10CƠ SỎ DỮ LIỆU ĐA PHƯƠNG TIỆN
Kiến trúc cho việc tổ chức dữ liệu multimedia
Nguyên lý tự trị (Principle of Autonomy)
Nguyên lý đồng nhất (Principle of Uniformity)
Nguyên lý lai ghép(Principle of Hybrid Organization)
Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất
Ngôn ngữ truy vấn khai thác dư liệu multimedia
Truy vấn SMDSs (mô tả đồng nhất)
Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo
Chỉ số hoá SMDS với chỉ số đảo
Trang 11Kiến trúc tổ chức dữ
liệu multimedia
Nguyên lý tự trị (Principle of Autonomy)
Mỗi loại dữ liệu đều được tổ chức theo cách dặc trưng
riêng
Cần được tính toán cho việc
join các cấu trúc dữ liệu
khác nhau
Liên kết nhanh trong thực hiện
xử lý truy vấn cấu trúc dặc biệt
Trang 12Kiến trúc tổ chức dữ
liệu multimedia
Nguyên lý đồng nhất(Principle of Uniformity)
Tạo chỉ số thống nhất cho tất cả các loại dữ liệu
Trìu tượng hóa các loại dữ
Trang 13Kiến trúc tổ chức dữ
liệu multimedia
Nguyên lý lai ghép(Principle of Hybrid
Organization) Tích hợp từ hai nguyên lý trên
Mỗi loại dữ liệu có một tập index riêng và các loại dữ liệu sử dụng chỉ index thống nhất
Trang 14Tổ chức dữ liệu dựa trên
nguyên lý đông nhất
Xem xét theo khía cạnh trạng thái của các dữ liệu media
chúng có thể được tạo bởi con người hay được cung cấp
bởi kỷ thuật truy vấn của hinh ảnh/ âm thanh/video.
Xét ví dụ ;
• Bức ảnh photo1.gif có sự xuất hiện của đối tượng A, đối tượng B
và một đối tượng chưa được xác định được chụp tại thành phố C thuộc nước D vào ngày 10/01/1990
• Đoạn video video1.mpg có hình ảnh của đối tượng A đưa cho đối tượng B một chiếc vali (trong frames 50-100) Đoạn video này thu được từ sự theo dõi nhà của đối tượng B tại thành phố E thuộc nước F vào tháng 1- 1991
• Văn bản B.txt có chứa các thông tin chi tiết về dối tượng B được thu thập từ dữ liệu của cơ quan an ninh
Trang 15 Nếu ta chuyển O1, On đối tượng media sang
md(O1) md(On) các đối tượng dữ liệu meta
Đây được xem là mong đợi của chúng ta với việc
thao tác với dữ liệu cấu trúc đơn giản.
Trang 16TRUY VẤN DỮ LIỆU MEDIA DỰA VÀO
TÍNH ĐỒNG NHẤT
Truy vấn dữ liệu dựa trên SQL và có các function cơ bản sau:
• FindType(Obj): hàm này sử dụng đối tượng media Obj làm đầu vào
và sẽ trả về kiểu của đối tượng, ví dụ:
FindType(image1.gif) = gif.
FindType(movie1.mpg) = mpg.
• FindObjWithFeature(f): hàm này sử dụng đặc trưng f là giá trị đầu
vào và trả về một tập tất cả các loại đối tượng media mà có chứa đặc trưng f, ví dụ
FindObjWithFeature(john)= {iml.gif,im2.gif,im3.gif,videol.mpg:[1,5]}
FindObjWithFeature(mary)= {videol.mpg: [1,5],videol.mpg:[15,50]}
Trang 17
TRUY VẤN DỮ LIỆU MEDIA DỰA
VÀO TÍNH ĐỒNG NHẤT
• FindObjWithFeatureAttr(f,a,v): hàm này sử dụng đặc trưng f, một
thuộc tính tên a kết hợp với đặc trưng này và một giá trị v là đầu
vào Giá trị trả về sẽ là tất cả các đối tượng o có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng o là v Ví dụ:
FindObjWithFeatureandAttr(Big Spender,suit,blue): Tìm tất cả
các đối tượng media mà có sự xuất hiện của Jane Shady trong chiếc
áo mầu blue.
FindObjWithFeatureandAttr(Elephant,bow,red): Tìm tất cả các đối
tượng media mà một con voi có mang một cái nơ mầu đỏ xuất hiện
• FindFeaturesInObj(Obj): câu hỏi này đòi hỏi phải tìm tất cả các đặc trưng có mặt trong một đối tượng media đã cho Kết quả trả về là một tập bao gồm tất cả các đặc trưng Ví dụ:
FindFeaturesInObj (im1.gif): tìm tất cả các đặc trưng có trong file
ảnh im1.gif.
FindFeaturesInObj(video1.mpg:[1,5]): Tìm tất cả các đặc trưng có
trong 5 frame đầu tiên của file video video1.mpg.
Trang 18TRUY VẤN DỮ LIỆU MEDIA DỰA
VÀO TÍNH ĐỒNG NHẤT
• FindFeatureandAttrinObj(Obj): hàm này cũng có chức năng
tương tự như hàm trước ngoại trừ việc nó trả về một quan hệ có
schema như sau: (Feature,Attribute,Value) trong đó cặp 3 (f,a,v) xuất hiện trong quan hệ đầu ra nếu thuộc tính a của đặc trưng f được xác định và có giá trị là v Ví dụ:
FindFeatureandAttrinObj (im1.gif) có thể trả về kết quả được mô tả ở
bảng sau
Trang 19TRUY VẤN SMDS BẰNG SMDS- SQL
SMDS-SQL mở rộng của chúng ta sẽ bao gồm tất cả các câu lệnh chuẩn của SQL có bổ sung thêm một số đặc
trưng của dữ liệu Multimedia vào SQL (bổ sung thêm vào SELECT, FROM, WHERE)
Tuyên bố Select có thể chứa thực thể media Một thực thể
media được định nghĩa như sau:
Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi
đó m : [i,j] là một thực thể media thể hiện một tập tất cả các
frame của đối tượng media m nằm trong (và chỉ trong) khoảng i
và j.
Nếu m không phải là một đối tượng media liên tục thì khi đó m
là một thực thể media.
Nếu m là một thực thể media và a là một thuộc tính của m thì
khi dó m.a là một thực thể media.
Trang 20TRUY VẤN SMDS BẰNG SMDS- SQL
• Tuyên bố FROM có thể có các thực thể theo mẫu sau:
(media) (source) (M), có nghĩa là chỉ có các đối tượng media
kết hợp với tên của kiểu media và tên của dữ liệu nguồn
được xem xét dến khi thực hiện câu hỏi và M là một biến
được xếp loại trên các đối tượng media đó.
• Tuyên bố WHERE cho phép có các biểu thức có dạng term In
func.call Trong đó:
Term có thể là một biến (trong trường hợp này được
sắp xếp trên kiểu trả về của func.call) hoặc là một đối tượng có kiểu đầu ra giống như func.call.
Func.call là một trong 5 hàm đã nêu ra ở trên.
Trang 21TRUY VẤN SMDS BẰNG SMDS-
SQL
VÍ dụ :
• Tìm tất cả các đối tượng ảnh hoặc video có chứa cả
Jane Shady và Denis Dopeman.
SELECT M
FROM smds source1 M
WHERE (FindType(M)=Video OR FindType(M)=Image)
AND M IN FindObjWithFeature(Big Spender)
AND M IN FindObjWithFeature(Jane Shady)
Trang 22TRUY VẤN SMDS BẰNG SMDS- SQL
Tìm tất cả các ảnh có chứa cả Jane Shady và Denis
Dopeman và Jane đứng bên trái Denis
Trang 23TRUY VẤN SMDS BẰNG SMDS- SQ
Tìm tất cả các ảnh có Jane Shady cùng với đối tượng xuất hiện trong đoạn Video cùng với Denis Hopeman Khác với câu hỏi trước, câu hỏi này đòi hỏi phải có các thao tác kết hợp giữa các loại dữ liệu khác
nhau Để thực hiện được câu hỏi này, chúng ta phải sử dụng các biến
mở rộng như là Person, biến này được dùng để tham chiếu đến đối
tượng chưa xác định được danh tính trong đoạn băng video.
Trang 24SMDS-SQL Có thể được sử dụng để truy vấn các đối tượng multimedia
đươc lưu trữ đồng nhất
“ Những thay đổi trong truy vấn của cơ sở dữ liệu lại tạo”
Để mở rộng ngôn ngữ truy vấn SMDS-SQL thành ngôn ngữ có thể truy
vấn được các dữ liệu được mô tả dưới dạng lai tạo (HM-SQL) các yêu cầu sau bắt buộc phải có:
• HM-SQL phải có khả năng thực hiện tất cả các câu hỏi sử dụng ngôn
ngữ riêng đối với nguồn dữ liệu không đồng nhất này.
• HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có
trách nhiệm “joins” giữa 2 nguồn dữ liệu SMDS và non-SMDS.
Ngôn ngữ HM-SQL cũng tương tự như ngôn ngữ SQL chuẩn ngoại trừ các mệnh đề Select, From Where được mở rộng như sau:
• Mệnh đề SELECT và WHERE được mở rộng giống như với ngôn ngữ
SMDS_SQL.
TRUY VẤN DỮ LIỆU MEDIA CÓ CẤU TRÚC
LAI TẠO
Trang 25• Mệnh đề SELECT và WHERE được mở rộng giống như với
ngôn ngữ SMDS_SQL.
• Tuyên bố Where cho phép sự có mặt của biểu thức có dạng
Term IN MS func_call trong đó:
o Term:có thể là một biến hoặc là một đối tượng có kiểu đầu ra giống
hệt với của func_call đã được định nghĩa trong media gốc và
o Nếu MS=SMDS hoặc họ func_call thuộc 1 trong 5 hàm đã đinh
Trang 26 Khi đó có 2 sự khác nhau giữa SMDS-SQL và HM-SQL là:
func_call xuất hiện trong mệnh đề where cần
được chú thích một cách tường minh với media gốc kèm theo và
Các câu hỏi được xây dựng từ các ngôn ngữ hỏi
đáp của từng loại dữ liệu non-SMDS có thể được nhúng vào bên trong câu lệnh truy vấn của
HMSQL Điều này làm cho HM_SQL trở nên hết sức mạnh mẽ và linh hoạt Căn cứ vào điều này chúng ta có thể thực thi các câu hỏi đối với các nguồn dữ liệu khác nhau.
TRUY VẤN DỮ LIỆU MEDIA CÓ CẤU TRÚC
LAI TẠO
Trang 27TRUY VẤN DỮ LIỆU MEDIA CÓ
CẤU TRÚC LAI TẠO
• Giả sử chúng ta có 2 nguồn dữ liệu video video1 và video2, nguồn video1 được triển khai qua hình thức SDMS, nguồn video2 được triển khai qua hình thức non-SDMS (gọi là
videob) Câu hỏi của chúng ta ở đây là “hãy tìm tất cả các video clip có mặt Denis Hopeman từ cả 2 nguồn dữ liệu
video1 và video2 Câu hỏi này có thể được diễn đạt bằng ngôn ngữ HM-SQL như sau:
Trang 28TRUY VẤN DỮ LIỆU MEDIA
CÓ CẤU TRÚC LAI TẠO
• Cũng với câu hỏi trên nhưng ở đây chúng ta thêm vào một nguồn dữ liệu mới là
dữ liệu hình ảnh (idb) được triền khai dưới hình thức non-SDMS và giả sử dữ
liệu hình ảnh này có riêng chức năng tìm kiếm getpic(obj) với tham số đầu vào là obj và kết quả trả về là một cặp bao gồm một ảnh (file ảnh) và thứ tự có lien
quan Giả sử chúng ta muốn tìm kiếm trên cả 3 loại dữ liệu này (video1, video2, idb) có mặt của đối tượng Denis Hopeman thì câu hỏi diễn đạt bằng ngôn ngữ HM-SQL có thể như sau:
Select M From sdms Video1, vi•eob Video2 Where M IN sdms: FindObjWithFeature(Denis Hopeman) OR
M IN videodb: FindVideoWithObj(Denis Dopeman)
Trang 29• Giả sử chúng ta muốn tìm tất cả các đối tượng có mặt cùng với Denis Dopeman trong tất cả các nguồn dữ liệu (video1, video2, idb), câu hỏi sẽ như sau
TRUY VẤN DỮ LIỆU MEDIA CÓ
CẤU TRÚC LAI TẠO
Trang 30XIN CHÂN THÀNH CẢM ƠN!!!
3/3