1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài giảng các nhiệm vụ thiết kế MMDBNS

38 815 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 38
Dung lượng 900,75 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

 Pha chèn đối tượng  User chỉ ra tệp hay phác họa một hay một nhóm Items thông qua UI  Tách tự động hay bán tự động đặc trưng  Gửi dữ liệu gốc và các đặc trưng đến servers  Các đặc

Trang 1

C ÁC NHIỆM VỤ THIẾT KẾ MMDBMS

Bài 3

PGS.TS Đặng Văn Đức dvduc@ioit.ac.vn

Trang 2

Nội dung

 Khái niệm mô hình hóa

 Kiến trúc MMDBMS

 Mô hình dữ liệu đa phương tiện

 Thiết kế giao diện người sử dụng

 Vấn đề trích chọn đặc trưng

 Đảm bảo chất lượng dịch vụ

 Kết luận

Trang 3

1 Mô hình hóa hệ thống thông tin

A model is a complete description of a system from a particular

Trang 4

Mô hình hệ thống phần mềm (UML)

Use Case Diagrams

Object Diagrams

Scenario DiagramsScenarioDiagramsStatechartDiagrams

Sequence Diagrams

Class Diagrams

Activity Diagrams

Models

Trang 5

 Conceptual (Logical) level

 Khung nhìn chung CSDL – dữ liệu nào được lưu trữ, quan hệ nào được trình diễn

 Bao gồm các thông tin về ngữ nghĩa và ràng buộc, an toàn và toàn vẹn dữ liệu

 Người quản trị nhìn thấy mức này

 Internel (physical) level

 Liên quan đến cách lưu trữ vật lý dữ liệu

 Phần lớn user và quản trị hệ thống không quan tâm đến mức này.

View 1 View 2 View 3

Conceptual schema

Internal schema

Database

User 1 User 2 User 3

External level

Conceptual level

Internal level

ANSI-SPARC

Trang 6

Data Access

Temporal models

User’s view

Distributed view

Conceptual data

view

Physical storage view

Trang 7

2.1 Kiến trúc cơ sở MMDBMS

 Yêu cầu tổng quát đối với kiến trúc MMDBMS

 Hỗ trợ các loại ứng dụng khác nhau

 Dễ dàng thêm bớt, sửa đổi các mođun của hệ thống

 Hỗ trợ phân tán trên nhiều servers, clients

 MMDBMS có các khối chức năng chính sau:

 Giao diện người sử dụng

 Bộ trích chọn đặc trưng

 Bộ quản lý truyền thông (trên clients và trên servers)

 Môtơ chỉ mục và tìm kiếm

 Bộ quản lý lưu trữ

Trang 8

Kiến trúc cơ sở MMDBMS

 Kiến trúc cơ sở của MMDBMS

thực hiện hai pha chính:

 Chèn dữ liệu

 Truy vấn thông tin

 Pha chèn đối tượng

 User chỉ ra tệp hay phác họa một

hay một nhóm Items thông qua UI

 Tách tự động hay bán tự động

đặc trưng

 Gửi dữ liệu gốc và các đặc trưng

đến server(s)

 Các đặc trưng được tổ chức theo

lược đồ chỉ mục tại server(s)

 Dữ liệu gốc và đặc trưng được

lưu trữ theo cấu trúc phù hợp

Giao diện Người sử dụng

Trang 9

Kiến trúc cơ sở MMDBMS

 Truy vấn thông tin

 User hình thành câu truy vấn từ

bàn phím, chuột thông qua UI (từ tệp hay phác họa)

 UI cho phép duyệt các Items trong

CSDL để chọn làm query

 Trích chọn đặc trưng nếu cần

 Gửi các đặc trưng đến server(s)

 Tìm kiếm các Items phù hợp nhất

với đặc trưng truy vấn

 Gửi các Item kết quả tới UI

 UI hiển thị danh sách các kết quả

Trang 10

2.2 Lưu trữ dữ liệu trong MMDBMS

Cơ sở dữ liệu đa phương tiện

Cơ sở dữ liệu đặc trưng

Trích chọn các đặc trưng

Trích chọn các đặc trưng

Các đặc trưng đã được trích chọn

Truy vấn

Kết quả

Đo mức độ tương tự

Dữ liệu đa phương tiện

Xây dựng cơ sở dữ liệu

đa phương tiện

Dữ liệu truy vấn

Trang 11

Kiến trúc hệ thống lưu trữ dữ liệu

Kiến trúc tự trị (autonomy)

 Mỗi loại media (ảnh, âm thanh, văn bản và video) được nhóm

riêng và được lưu trữ theo cách riêng

 Nhận xét

 Tương tác giữa các loại media là phức tạp, đòi hỏi lập trình nhiều

 Thích hợp cho sự kế thừa dữ liệu

User

Multimedia Query Engine

Document Index Image Index Audio Index Video Index

Trang 12

Kiến trúc hệ thống lưu trữ dữ liệu

Kiến trúc đồng nhất (uniformity)

 Hình thành cấu trúc dữ liệu trừu tượng với khả năng hỗ trợ chỉ

mục phần chung cho toàn bộ các kiểu media

 Nhận xét

 Dễ cài đặt, thuật toán chạy nhanh

 Tương tác thuận tiện giữa các loại media vì có cùng cấu trúc dữ

Trang 13

Kiến trúc hệ thống lưu trữ dữ liệu

Kiến trúc lai (hybrid)

 Kết hợp 2 kiến trúc tự trị và kiến trúc đồng nhất

 Một số kiểu dữ liệu sử dụng chỉ mục của riêng nó, một số khác

sử dụng theo kiến trúc uniformity

 Nhận xét:

 Tận dụng được ưu điểm

và giảm thiểu nhược điểm của 2 loại trên

Trang 14

3 Mô hình dữ liệu đa phương tiện

 Mô hình dữ liệu?

 Là mô hình trừu tượng đặc tả cách thức trình diễn và sử dụng

dữ liệu trong hệ thống

 Xác định thông tin được tổ chức và lưu trữ như thế nào, hỗ trợ

loại truy vấn nào

 Mô hình dữ liệu tốt?

 Khả năng mở rộng để bổ sung kiểu dữ liệu mới

 Khả năng trình diễn các kiểu đối tượng cơ sở và các đối tượng

tổ hợp với các quan hệ về không gian, thời gian phức tạp

tượng khác nhau

 Cho khả năng lưu trữ, tìm kiếm hiệu quả

 Tuân thủ chuẩn quốc tế để trao đổi, phân tán dữ liệu

Trang 15

3.1 Mô hình dữ liệu đa phương tiện

 Vai trò của mô hình dữ liệu tổng quát là cung cấp khung

làm việc (hoặc ngôn ngữ) để người sử dụng có thể:

 Biểu diễn thuộc tính dữ liệu được hệ thống lưu trữ và tìm kiếm

 Cho khả năng định nghĩa, chèn, hủy, sửa đổi và tìm kiếm mục

dữ liệu và các thuộc tính dữ liệu

 Với MMDBMS, mô hình dữ liệu còn bổ sung khả năng

 Đặc tả, tính toán ở mức trừu tượng khác nhau trên dữ liệu đa

phương tiện

 Thu thập các tính chất tĩnh và động của các mục dữ liệu

 Tĩnh: đối tượng hình thành đa phương tiện, thuộc tính, quan hệ của chúng

 Động: Tương tác giữa các đối tượng, giữa đối tượng và người sử dụng.

 Hỗ trợ các kiểu media cơ bản, có khả năng hình thành các đặc

trưng bổ sung

 Hỗ trợ trình diễn không gian đa chiều và thước đo khoảng cách

Trang 16

Yêu cầu mô hình dữ liệu đa phương tiện

 Mô hình dữ liệu đa phương tiện phải có khả năng mở

rộng để bổ sung loại dữ liệu mới

 Có khả năng trình diễn kiểu dữ liệu cơ sở và và các đối

tượng phức hợp với các quan hệ thời gian và không gian phức tạp

 Mềm dẻo để các mục dữ liệu có thể được đặc tả, truy

vấn và tìm kiếm ở các mức độ trừu tượng khác nhau

 Cho phép lưu trữ và tìm kiếm hiệu quả.

Trang 17

Không gian Thời gian Tổng hợp

Video

Tầng đối tượng

Tầng kiểu media

Tầng khuôn mẫu media

Ảnh Đồ họa

3.2 Mô hình dữ liệu MM tổng quát

Trang 18

Mô hình dữ liệu đa phương tiện tổng quát

 Tầng đối tượng

 Đối tượng bao gồm một hay nhiều media Items với các quan hệ

không gian và thời gian xác định

 Thí dụ: đối tượng là một trang slide bao gồm vài ảnh và audio kèm theo.

 Nhiệm vụ: chỉ ra quan hệ không gian và thời gian giữa các

media

 Tầng loại media

 Bao gồm các loại media chung suy diễn từ lớp media trừu

tượng

 Đặc tả đặc trưng và thuộc tính các media

 Thí dụ: kích thước, biểu đồ màu, các đối tượng chính nó chứa

 Tầng khuôn mẫu media

 Đặc tả khuôn mẫu, trong đó dữ liệu được lưu trữ

 Nhận xét

 Chưa có chuẩn chung cho các tầng mô hình dữ liệu

 Các ứng dụng MMDBMS chủ yếu là đặc thù, chỉ tập trung vào

Trang 19

3.3 Ví dụ mô hình video tổng quát

Trang 20

Mô hình video tổng quát

 Bao gồm 4 tầng:

 Frame là các video và ảnh độc lập

 Shot là tập các frames được ghi hình bằng camera trong một

lần bấm máy

 Scene (sequence) là tập các shot có cùng ngữ nghĩa

 Episode là tập các scenes trong trình tự cụ thể Là một đơn vị

sản phẩm (thí dụ, chương trình bản tin TV)

 Các thuộc tính được gắn vào từng tầng video

 Episode: gán dữ liệu như tiêu đề, tác giả, ngày tháng tạo lập và

các thông tin liên quan đến kiểu video như chương trình tin tức

 Scene: chứa ngữ nghĩa chung chia sẻ giữa các shot của nó

 Shot: được đặc trưng bởi các khung hình đại diện và các dữ liệu

như các đối tượng chính, ngày tháng và nơi bấm máy

 Frame: chứa dữ liệu ảnh thô, thống kê ảnh như biểu đồ màu

Trang 21

4 Thiết kế giao diện người sử dụng

 Người sử dụng giao tiếp, tương tác với MMDBMS thông

qua giao diện

 UI xác định tính sử dụng được của hệ thống

 UI hỗ trợ các công việc chính sau

 Chèn các Items vào CSDL

 Nhập câu truy vấn

 Trình diễn kết quả truy vấn

 Một UI tốt cần thỏa mãn các yêu cầu sau

 Có công cụ để người sử dụng dễ dàng chèn các đối tượng dữ

liệu vào CSDL

 Có công cụ để người sử dụng nhập câu truy vấn một cách hiệu

quả và thông báo cho hệ thống những thông tin mà nó cần

 Trình diễn hiệu quả kết quả truy vấn

 Thân thiện với người sử dụng

Trang 22

4.1 UI hỗ trợ thu thập dữ liệu

 CSDL truyền thống

 Bản ghi có cấu trúc cố định với tổng số thuộc tính cố định

 Chèn bản ghi vào CSDL bằng ngôn ngữ SQL

 Mục dữ liệu trong CSDL có thể có kiểu bất kỳ hay tổ hợp nhiều

kiểu media khác nhau

 Không có cấu trúc và thuộc tính cố định

 Do vậy, UI hỗ trợ user đặc tả kiểu đầu vào khác nhau, tổ hợp

các đối tượng MM và chỉ ra kiểu thuộc tính sẽ trích chọn và chỉ mục

UI hỗ trợ Query by Example.

 Việc xử lý và trích chọn đặc trưng đòi hỏi nhiều tính toán,

 Thời gian trích chọn từ (vài giây)/(đối tượng) đến (vài giờ)/(đối tượng phức tạp) như phim.

 Do vậy, UI phải có khả năng đặc tả các thao tác trên “nhóm đối tượng” để

Trang 23

4.2 UI hỗ trợ tìm kiếm và duyệt

 Tìm kiếm theo hai cách

 Tìm kiếm theo đặc tả đặc trưng

 Cho phép user sử dụng các từ khóa, tham số để đặc tả đặc trưng hay thuộc tính về nhu cầu thông tin.

 Tìm kiếm theo ví dụ

“An image is worth a thousand words”

 UI cần có các công cụ đầu vào khác nhau như micro, camera

 Duyệt

 Khi không biết chính xác cái muốn tìm kiếm

 Ba phương pháp khởi đầu duyệt

 Từ truy vấn không rõ ràng sau đó user duyệt các items trong kết quả

 Thông tin trong CSDL được tổ chức theo vài tiêu chí nào đó (ngày tháng, chủ điểm) để user có thể duyệt theo các tiêu chí này

 Chọn ngẫu nhiên một số items từ CSDL để duyệt Thực hiện lặp nếu chưa đáp ứng yêu cầu.

 Biểu diễn Icon để duyệt hiệu quả

Trang 24

4.3 UI hỗ trợ làm mịn truy vấn

 Thực hiện trên cơ sở phản

hồi thích hợp của kết quả khởi đầu

 Thực tế:

 Truy vấn thông tin đa

phương tiện là tiến trình tổ hợp của cả ba loại: tìm kiếm, duyệt và làm mịn

Trang 25

4.4 UI hỗ trợ trình diễn kết quả

 Trình diễn mọi loại media và quản lý các quan hệ không

gian và thời gian của chúng.

 Đảm bảo trình diễn audio, video dài và ảnh lớn

 Khả năng trình diễn thông tin chính để user duyệt và chọn

 Ảnh thumbnail hay biểu tượng phim là các công cụ đặc biệt

quan trọng

 Thời gian đáp ứng hệ thống phải ngắn

 Thời gian đáp ứng được xác định bởi phân hệ truyền tin và tìm

kiếm trong CSDL

 Một kỹ thuật để có cảm giác giảm thời gian đáp ứng là giải mã

tăng dần (progressive) và hiển thị.

 Hỗ trợ phản hồi liên quan và làm mịn truy vấn

Trang 26

Ví dụ UI hỗ trợ trình diễn kết quả

Trang 27

Ví dụ UI hỗ trợ trình diễn kết quả

Trang 28

Ví dụ UI hỗ trợ trình diễn kết quả

Trang 29

5 Vấn đề trích chọn đặc trưng

 Các đặc trưng và thuộc tính của các mục thông tin được

trích chọn, tham số hóa, tổ chức trong cấu trúc có chỉ

mục và lưu trữ cùng với các Items.

 Các yêu cầu trích chọn đặc trưng

 Đặc trưng phải được trích chọn đầy đủ nhất có thể để biểu diễn

nội dung của các mục thông tin

 Phải được trình diễn và lưu trữ một cách chặt chẽ, mạch lạc

 Không trích chọn đặc trưng phức tạp và đặc trưng lớn

 Phải có khả năng tìm kiếm và so sánh nhanh các đối tượng với nhau.

 Tính toán khoảng cách giữa các đặc trưng phải hiệu quả

 Ngược lại, thời gian đáp ứng của hệ thống rất lớn.

 Thông thường có bốn mức đặc trưng và thuộc tính

 Metadata

 Mô tả (annotation) bằng văn bản

 Đặc trưng nội dung mức thấp

 Đặc trưng nội dung mức cao.

Trang 30

5.1 Bốn mức của đặc trưng và thuộc tính

 Meta-data

 Bao gồm các thuộc tính như tên tác giả, ngày tạo lập, tiêu đề

 Các thuộc tính này được quản lý bằng kỹ thuật DBMS

 Mô tả bằng văn bản

 Mô tả dưới hình thức nhiều từ khóa hay văn bản thông thường

 Sử dụng kỹ thuật tìm kiếm thông tin văn bản (IR) để chỉ mục và

tìm kiếm

 Nội dung mức thấp

 Thu thập các mẫu dữ liệu, thống kê đối tượng, các quan hệ

không gian và thời gian giữa các bộ phận đối tượng

 Mỗi media khác nhau có đặc trưng mức thấp khác nhau

 Nội dung mức cao

 Nhận dạng và hiểu đối tượng

 Nhận dạng các đối tượng nhìn thấy còn rất khó khăn

Trang 31

5.2 Chỉ mục và thước đo tương tự

 Cấu trúc chỉ mục

 Nhu cầu tổ chức đặc trưng trong cấu trúc chỉ mục để tìm kiếm

hiệu quả sau khi trích chọn đặc trưng

 Chỉ mục phân cấp và nhiều mức, bao gồm:

 Truy vấn trên cơ sở tính tương tự thay cho đối sánh chính xác

 Mức độ tương tự được tính toán trên cơ sở các đặc trưng dưới

dạng một hay nhiều giá trị

 Kết quả truy vấn do con người quyết định

 Độ đo tính tương tự rất phức tạp vì quyết định của người sử

dụng là chủ quan và thường phụ thuộc ngữ cảnh

Trang 32

6 Đảm bảo chất lượng dịch vụ (QoS)

 Yêu cầu của MMDBMS (thông thường là phân tán)

 Đòi hỏi băng thông rộng,

 Không gian lưu trữ lớn

 Tốc độ đường truyền cao

 Giới hạn jiter, độ trễ

 Đồng bộ không gian, thời gian

 Khung làm việc (hay QoS) được đề xuất để đáp ứng yêu

cầu trên

 QoS là tập các tham số yêu cầu Là hợp đồng giao kèo

giữa ứng dụng và hệ thống.

 Các hình thức đảm bảo QoS

 Thỏa mãn hoàn toàn QoS

 Đảm bảo với xác suất nhất định p

 Không đảm bảo: Ứng dụng thực hiện lâu tùy ý

Trang 33

Đảm bảo chất lượng dịch vụ

 Một hệ thống đa phương tiện điển hình bao gồm: Hosts

(bao gồm cả clients và servers) dưới điều khiển của OS,

bộ quản lý lưu trữ, hệ thống truyền tin và giao vận.

 QoS được đảm bảo khi các tài nguyên hệ thống (ví dụ

chu kỳ CPU, bộ nhớ, băng thông ) được quản lý đúng đắn

 Vấn đề nghiên cứu QoS đặt ra là:

 Chuyển đổi các tham số QoS sang các yêu cầu tài nguyên

 Phân chia các phiên làm việc để nhiều phiên làm việc đều được

đáp ứng bởi số lượng cố định tài nguyên

Trang 34

Khung làm việc của QoS

- Jitter Delay

- Bandwidth

- Packet Loss Rate

- Storage Throughput/

Bandwidth

- Storage Delays

- Distributed Database Coordination (QoS)

- CPU Throughput

- Memory Overflow and Reliability

- Intrusion Detection

- Access Control

OS Network

End-to-End

Run Time

Trang 35

7 Nén dữ liệu

 Nhiệm vụ nén dữ liệu

 Mục tiêu chính của nén là làm giảm thiểu khối lượng lưu trữ

 MMDBMS đòi hỏi nén/giải nén nhiều lần

 Cần lựa chọn kỹ thuật nén sao cho chỉ mục và tìm kiếm trên dữ

liệu nén hiệu quả: DCT, lượng tử véctơ, wavelet

 Chuyển đổi ảnh raster sang véctơ mỗi khi có thể

 Nên sử dụng ảnh JPEG2000, MPEG-4 để dễ dàng có ảnh

thumbnail.

Trang 36

8 Kết luận

 Nhiệm vụ và yêu cầu thiết kế của MMDBMS, bao gồm:

 Mô hình và kiến trúc hệ thống

 Mô hình hóa dữ liệu

 Giao diện người sử dụng

 Trích chọn đặc trưng

 Chỉ số hóa, Đo độ tương tự đặc trưng

 Đảm bảo QoS

 Nén dữ liệu

 Chuẩn hóa trình diễn dữ liệu

 Xử lý truy vấn và truy tìm thông tin đa phương tiện

Trang 37

Câu hỏi ôn tập

 Mô tả kiến trúc tổng quát của MMDBMS

 Mô tả vai trò mô hình dữ liệu trong MMDBMS, sự khác

biệt về yêu cầu mô hình dữ liệu của DBMS và

MMDBMS

 Tại sao phải trích chọn đặc trưng dữ liệu MM?

 Mô tả chức năng chính của UI trong MMDBMS

 QoS là gì? Mô tả nguyên lý cơ bản của đảm bảo chất

lượng dịch vụ.

Trang 38

Câu hỏi?

Ngày đăng: 27/09/2015, 08:12

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w