Trong thời đại ngày nay, công nghệ thông tin (CNTT) đã phát triển vượt bậc đến mức ăn sâu vào cuộc sống hàng ngày của con người. Sự phát triển của CNTT gắn với các xu hướng như máy tính cá nhân được sử dụng ngày càng phổ biến; công nghệ phần cứng phát triển không ngừng mang đến các thiết bị nghe nhìn có độ phân giải cao, có khả năng hiển thị nội dung đa phương tiện tuyệt vời; bên cạnh đó hạ tầng kỹ thuật mạng được cải thiện đáng kể cho phép nội dung đa phương tiện có thể truyền tải qua mạng nhanh nhất, phục vụ các nhu cầu của người dùng từ giải trí đến công việc. Tuy nhiên, cho đến khi nhu cầu của người dùng và khả năng đáp ứng về dữ liệu đa phương tiện là rất lớn thì phát sinh một vấn đề là làm sao quản lý và khai thác dữ liệu đa phương tiện một cách tốt nhất? Các dữ liệu đa phương tiện hoàn toàn có thể lưu trữ trên đĩa và truy cập một cách truyền thống, nhưng để đáp ứng yêu cầu nêu trên thì ta cần phải tổ chức chúng thành một cơ sở dữ liệu (CSDL) đa phương tiện và cần tới một hệ quản trị CSDL đa phương tiện dùng để quản lý và hỗ trợ khai thác chúng. Vậy CSDL đa phương tiện là gì? Tại sao lại cần dùng đến CSDL đa phương tiện? Các nền tảng lý thuyết của CSDL đa phương tiện và ứng dụng của nó là gì? Các nội dung trên chúng ta sẽ cùng tìm hiểu trong đề tài này.
Trang 1Nhóm 04 – Lớp SP Tin 4
Khoa Công nghệ thông tin
Môn Cơ sở dữ liệu nâng cao
Trang 3Tổ chức nội dung trong CSDL ĐPT
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Trang 4CSDL đa phương tiện là một tập hợp các dữ liệu đa phương tiện có liên quan với nhau
Tích hợp audio và video
Tích hợp văn bản và hình ảnhHình ảnh
Siêu phương tiện
Văn bản
Video KTS
Ảnh vectơAudio
Dữ liệu liên tục là dữ liệu thay đổi theo thời gian Dữ liệu không liên tục là các dữ liệu không phụ thuộc
theo thời gian
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
4
Trang 5TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Temporality Logistics
Lack of structure
Massive
Đặc trưng
Trang 6Các dữ liệu đa phương tiện có kích thước lớn và sẽ ảnh hưởng đến việc lưu trữ, truy xuất
và truyền tải các nội dung đa phương tiện
Cấu trúc của dữ liệu đa phương tiện khác xa so với các CSDL chuẩn
Các kiểu dữ liệu có tính chất liên tục (như video và audio) không thể xử lý được trong
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
6
Trang 7TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Trang 8Nguyên lý tự trị (atonomy)
Nguyên lý này đảm bảo rằng với
mỗi loại dữ liệu (ảnh, video, văn
bản) đều được tổ chức theo một
cách thức phù hợp với đặc trưng
của mỗi loại dữ liệu này.
Mô hình nguyên lý tự trị
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
8
Trang 9Nguyên lý tự trị (atonomy)
Các kiến trúc dựa trên nguyên lý tự trị đòi hỏi:
− tạo ra các thuật toán và cấu trúc dữ liệu của mỗi kiểu dữ liệu
− các kỹ thuật hỗ trợ cho việc liên kết chéo giữa các cấu trúc dữ liệu khác nhau
này
Các công việc này đòi hỏi tính phức tạp cao và đòi hỏi một lượng thời gian
lớn cho việc phát triển
Việc xây dựng các cấu trúc chuyên biệt hóa đem lại sự tối ưu cho việc truy xuất
và hiệu quả cao trong việc xử lý tìm kiếm
Các kỹ thuật hướng đối tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương thức của nó có thể truy cập được từ một CSDL đa phương tiện tổng thể.
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Trang 10Nguyên lý đồng nhất (uniformily)
Mô hình nguyên lý đồng nhất
Trình bày tất cả các đối tượng khác nhau trong một cấu trúc dữ
liệu duy nhất và qua đó phát triển các thuật toán để truy vấn cấu
trúc dữ liệu này
Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi
hỏi chúng ta phải tìm ra được một cấu trúc dữ liệu chung
mà có thể dùng để lưu trữ các thông tin về nội dung của
các kiểu dữ liệu khác nhau
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
10
Trang 11Nguyên lý đồng nhất (uniformily)
Dễ dàng triển khai và các thuật toán thường được thực hiện rất nhanh
− Các sự chú giải phải được tạo ra theo một cách riêng nào đó,
thường là được tạo ra một cách thủ công hoặc là tự động
tốn nhiều thời gian cũng như chi phí
− thường xảy ra sự mất mát thông tin
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Trang 12Nguyên tắc lai ghép (hybrid)
Mô tả nguyên lý lai ghép
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
12
Trang 13Nguyên tắc lai ghép (hybrid)
Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời giảm thiểu được một số các nhược điểm của chúng
− Phần 1: tận dụng được lợi thế của các chỉ số và mã
nguồn sẵn có Nguyên lý tự trị
Phần 2: tập các dữ liệu không có nguồn sẵn, các chỉ số của mình
Nguyên lý đồng nhất
Xây dựng các thuật toán cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng việc sử dụng các tập chỉ số riêng của chúng
Thừa kế được tối đa các tài nguyên có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện thêm
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Trang 15Có 2 phương pháp truy vấn:
Ngôn ngữ truy vấn
dữ liệu đa phương tiện
Sử dụng các thông tin được nhập thủ công hay bao gồm trong thiết kế của bảng, như tiêu đề, các từ khóa mô tả
Sử dụng các thông tin được nhập thủ công hay bao gồm trong thiết kế của bảng, như tiêu đề, các từ khóa mô tả
Thứ nhất, truy xuất dựa trên thuộc tính
Sử dụng các đặc trưng được rút trích từ nội dung của đối tượng đa phương tiện và sự nhận diện đối tượng để phân loại nội dung dữ liệu đa phương tiện
Sử dụng các đặc trưng được rút trích từ nội dung của đối tượng đa phương tiện và sự nhận diện đối tượng để phân loại nội dung dữ liệu đa phương tiện
Thứ hai, truy xuất dựa trên nội dung
Trang 16Các hàm cơ bản của SMDSs:
Truy vấn SMDSs (Mô tả đồng nhất)
FindType(Obj): hàm này dùng đối tượng Obj như là dữ liệu đầu vào và trả về kiểu của đối tượng, ví dụ:
FindObjWithFeature(f): hàm này này sử dụng đặc trưng f là giá trị đầu vào và trả về một tập tất cả các
loại đối tượng media mà có chứa đặc trưng f, ví dụ:
Trang 17 FindObjWithFeatureandAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc tính tên a kết hợp với đặc
trưng này và một giá trị v là đầu vào Giá trị trả về sẽ là tất cả các đối tượng obj có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng obj là v Ví dụ:
o FindObjWithFeatureandAttr(Big Spender,suit,blue)
FindObjWithFeatureandAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc tính tên a kết hợp với đặc
trưng này và một giá trị v là đầu vào Giá trị trả về sẽ là tất cả các đối tượng obj có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng obj là v Ví dụ:
o FindObjWithFeatureandAttr(Big Spender,suit,blue)
FindFeaturesinObj(Obj): câu truy vấn này đòi hỏi phải tìm tất cả các đặc trưng có mặt trong một
đối tượng media đã cho Kết quả trả về là một tập bao gồm tất cả các đặc trưng Ví dụ:
Trang 18 FindFeaturesandAttrinObj(Obj): có chức năng tương tự như hàm trước ngoại trừ việc nó trả
về một quan hệ có schema là (Feature, Attribute,Value) Ví dụ:
o FindFeaturesandAttrinObj(iml.gif)
FindFeaturesandAttrinObj(Obj): có chức năng tương tự như hàm trước ngoại trừ việc nó trả
về một quan hệ có schema là (Feature, Attribute,Value) Ví dụ:
o FindFeaturesandAttrinObj(iml.gif)
18
Truy vấn SMDSs (Mô tả đồng nhất)
Trang 19SMDS-SQL câu lệnh
chuẩn của SQL
câu lệnh chuẩn của SQL
một số đặc trưng của DL ĐPT
một số đặc trưng của DL ĐPT
Một số đặc trưng của DL đa phương tiện bổ sung vào SQL:
<media><source><M>
term IN func_call
Truy vấn SMDSs (Mô tả đồng nhất)
Trang 21Truy vấn dữ liệu ĐPT
mô tả dưới kiến trúc lai tạo
Trong kiến trúc lai tạo, các dữ liệu nguồn được
truy vấn gồm cả SMDSs và non-SMDS.
Trong kiến trúc lai tạo, các dữ liệu nguồn được
truy vấn gồm cả SMDSs và non-SMDS.
Cách thức mô tả DL kiểu lai tạo có 2 phần chính:
• Một tập các đối tượng media được mô tả dưới dạng đồng nhất
• Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy vấn riêng
Cách thức mô tả DL kiểu lai tạo có 2 phần chính:
• Một tập các đối tượng media được mô tả dưới dạng đồng nhất
• Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy vấn riêng
Trang 22DL SMDS và non-SMDS
HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có trách nhiệm “joins” giữa 2 nguồn
Trang 23Ngôn ngữ HM-SQL: tương tự như ngôn ngữ SQL chuẩn và Select, From, Where
được mở rộng như sau:
Ngôn ngữ HM-SQL: tương tự như ngôn ngữ SQL chuẩn và Select , From, Where được mở rộng như sau:
Mệnh đề SELECT và FROM được mở rộng giống như với ngôn ngữ SMDS- SQL
Mệnh đề WHERE cho phép sự có mặt của biểu thức có dạng
Term IN MS: func_call
Truy vấn dữ liệu ĐPT
mô tả dưới kiến trúc lai tạo
Trang 24FROM smds video1, videodb video2
WHERE M IN smds:FindObjWithFeature(Denis Hopeman)
OR
M IN videodb:FindVideoWithObject(Denis Hopeman)
FROM smds video1, videodb video2
WHERE M IN smds:FindObjWithFeature(Denis Hopeman)
Trang 25Khái niệm
1
Kiến trúc của Hệ QT CSDL ĐPT
2
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
3 Các yêu cầu của Hệ QT CSDL ĐPT
Các vấn đề của CSDL ĐPT
4
Trang 26Hệ quản trị CSDL đa phương tiện (Multimedia Database Management System) là một hệ quản trị CSDL hỗ trợ việc tạo lập , cập nhật và khai thác
CSDL đa phương tiện
Khái niệm
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
26
Trang 27Tính năng
MDBMS
một số chức năng mới và tính năng nâng cao
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
các phương thức đặc biệt để tối ưu hoá việc lưu trữ, truy cập, chỉ số hoá và khai thác.
Trang 28Kiến trúc của hệ quản trị CSDL đa phương tiện
Navigation
Tool
Multimedia International/ Media composition & Integration meta - model Query processing
Text DBMS Images DBMS Audio
DBMS
Video DMBS
Images Audio Video
Interactive Layer
Layer 2
Multimedia Object Management Layer and Query Processing
Layer 1
monomedia management layer
database-Cung cấp các chức năng cần thiết cho việc quản lý các phương tiện đơn lẻ hoặc cá thể (individual
media)
Mục tiêu: xử lý các truy vấn dựa
trên nội dung và tạo thuận lợi cho
sự truy xuất của các mảnh phù hợp của dữ liệu đơn phương tiện
Mục tiêu: tích hợp đơn phương
tiện để tạo ra các tài liệu đa phương tiện và liên kết chéo tới các thông tin được lưu trữ trong các CSDL đơn phương tiện
duy trì một mô hình tích hợp đơn phương tiện đa chiều, dưới hình thức của một siêu lược đồ (meta-
schema)
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
xử lý các truy vấn của người dùng cho việc tổng hợp các thông tin
đa phương tiện và tạo ra các truy vấn con (subqueries) cho các CSDL đơn phương tiện
gồm nhiều phương tiện giao tiếp người dùng nhằm hỗ trợ các chức năng trình diễn đa phương tiện
28
cung cấp sự phối hợp giữa các CSDL đơn phương tiện nếu chúng được phân phối
Trang 29Các yêu cầu của Hệ QT CSDL đa phương tiện (MDBMS)
Đầy đủ các khả năng của một DBMS truyền thống
Có khả năng lưu trữ lớn
Có khả năng khai thác dữ liệu thuận tiện
Có khả năng tích hợp, tổng hợp và thể hiện
Hỗ trợ truy vấn đa phương tiện
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Trang 30HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Các vấn đề của
CSDL đa phương
tiện
Mô hình hóa dữ liệu đa phương tiện
Lưu trữ đối tượng đa phương tiện
Chỉ số hóa đa phương tiện
Hỗ trợ truy vấn đa phương tiện, khai thác và duyệt
32
Trang 31HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Mô hình hóa dữ liệu đa phương tiện
Mô hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL đa phương tiện;
Một mô hình dữ liệu cần phải tách rời người dùng ra khỏi chi tiết của việc quản lý các thiết bị lưu trữ và cấu trúc lưu trữ Đòi hỏi mô hình tương ứng để tổ chức các kiểu dữ liệu khác nhau;
Mô hình dữ liệu cung cấp các khuôn mẫu cơ bản cho việc phát triển các công cụ cần thiết
để sử dụng dữ liệu đa phương tiện.
xây dựng một mô hình dữ liệu đa phương tiện trên
nền tảng của mô hình dữ liệu của một CSDL truyền
thống
xây dựng một mô hình dữ liệu đa phương tiện trên
nền tảng của mô hình dữ liệu của một CSDL truyền
Trang 32HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Lưu trữ đối tượng đa phương tiện
Yêu cầu lưu trữ
Các cơ chế nén dữ liệu + cơ chế chuyển đổi dữ liệu
làm giảm các yêu cầu khổng lồ về mặt lưu trữ, loại bỏ
sự dư thừa của dữ liệu gốc
Các quá trình giải nén sẽ làm nhiệm vụ chuyển đổi ngược các dữ liệu này về dạng gốc của nó, và quá trình này dẫn đến mất mát dữ liệu nhưng trong giới hạn cho phép.
34
cách phân chia dữ liệu thành các đối tượng đa phương tiện nhỏ hơn
để có thể lưu trữ trong các đơn vị lưu trữ nhỏ hơn.
Trang 33HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Chỉ số hóa đa phương tiện
Sử dụng các từ khoá là phương pháp
chiếm ưu thế để chỉ số hoá dữ liệu đa
phương tiện Lựa chọn từ khóa từ tập các
Trang 34HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
ĐA PHƯƠNG TIỆN
Hỗ trợ truy vấn đa phương tiện, khai thác và duyệt
Các truy vấn của người dùng thường được xử lý bằng cách sử dụng các chỉ số có sẵn Tuy nhiên, tính chính xác trong tìm kiếm đối với dữ liệu đa phương tiện không phải là chính xác tuyệt đối
nhiều nghiên cứu đi sâu vào việc tìm ra một phương pháp thích hợp trợ giúp người dùng khai thác hiệu quả, chẳng hạn cung cấp các giao diện thích hợp.
Phương thức chính để truy vấn đối với CSDL đa phương tiện là Truy vấn bằng ví dụ (Query-by-Example) giao diện
được sử dụng để nhập truy vấn vào hệ thống trở thành một vấn đề cần phải quan tâm
36
Trang 35Giới thiệu
1
Công nghệ quan hệ - đối tượng
2
3 Lưu trữ và truy vấn đa phương tiện
Nạp dữ liệu đa phương tiện
4
ORACLE MULTIMEDIA
Trang 36L Ý
TRUY XUẤT
Reliability Availability Data management
Trang 37ORACLE MULTIMEDIA
Công nghệ quan hệ đối tượng
Công nghệ QH-ĐT vừa cung cấp khả năng quản lý an toàn và hiệu quả dữ
liệu quan hệ, vừa cung cấp các định nghĩa về đối tượng
Công nghệ QH-ĐT vừa cung cấp khả năng quản lý an toàn và hiệu quả dữ
liệu quan hệ, vừa cung cấp các định nghĩa về đối tượng
Công nghệ này hỗ trợ tích hợp các BLOB để cung cấp cơ sở cho việc bổ sung các
đối tượng phức tạp: ORDAudio, ORDVideo, ORDImage, ORDDoc
Công nghệ này hỗ trợ tích hợp các BLOB để cung cấp cơ sở cho việc bổ sung các
đối tượng phức tạp: ORDAudio, ORDVideo, ORDImage, ORDDoc
Trang 38ORACLE MULTIMEDIA
Vài ứng dụng của Oracle Multimedia
Hồ sơ sức khỏe điện tử
Tổng đài điện thoại
Học từ xa và học trực tuyến
Tiếp thị bất động sản
Phòng trưng bày nghệ thuật kĩ thuật số
Lưu trữ các web nhạc và video
Trang 39ORACLE MULTIMEDIA
Lưu trữ dữ liệu đa phương tiện
OM có thể lưu trữ DL ĐPT ở dạng nội bộ hoặc như một nguồn bên ngoài
Các BLOB được lưu trữ trong các tablespace và locator của nó được lưu trữ trong hàng
Các BFILE không đặt trong kiểm soát giao tác nên dễ gây ra mâu thuẫn với locator khi cập nhật nó
Trang 40hoặc đặc trưng nội dung
Trang 41ORACLE MULTIMEDIA
Nạp dữ liệu đa phương tiện
Có 2 công cụ để thực hiện:
SQL*Loader là một công cụ của Oracle cho phép nạp
dữ liệu từ các tập tin ĐPT bên ngoài vào các các bảng
có cột kiểu đối tượng OM
Ưu điểm: dễ kiểm soát hoạt động nạp dữ liệu qua
logfile
PL/SQL là ngôn ngữ lập trình bậc cao thế hệ thứ 4 của Oracle, là
sự mở rộng của SQL.
Ưu điểm: có thể gọi các phương thức khi tải dữ liệu để tạo ra các
hình ảnh thu nhỏ, hoặc trích xuất thuộc tính
Trang 42Thực hiện: Nhóm 04 – Lớp SP Tin 4
CẢM ƠN THẦY
VÀ CÁC BẠN
ĐÃ THEO DÕI!