Pha chèn đối tượng User chỉ ra tệp hay phác họa một hay một nhóm Items thông qua UI Tách tự động hay bán tự động đặc trưng Gửi dữ liệu gốc và các đặc trưng đến servers Các đặc
Trang 1C ÁC NHIỆM VỤ THIẾT KẾ MMDBMS
Bài 3
PGS.TS Đặng Văn Đức dvduc@ioit.ac.vn
Trang 2Nội dung
Khái niệm mô hình hóa
Kiến trúc MMDBMS
Mô hình dữ liệu đa phương tiện
Thiết kế giao diện người sử dụng
Vấn đề trích chọn đặc trưng
Đảm bảo chất lượng dịch vụ
Kết luận
Trang 31 Mô hình hóa hệ thống thông tin
A model is a complete description of a system from a particular
Trang 4Mô hình hệ thống phần mềm (UML)
Use Case Diagrams
Object Diagrams
Scenario DiagramsScenarioDiagramsStatechartDiagrams
Sequence Diagrams
Class Diagrams
Activity Diagrams
Models
Trang 5 Conceptual (Logical) level
Khung nhìn chung CSDL – dữ liệu nào được lưu trữ, quan hệ nào được trình diễn
Bao gồm các thông tin về ngữ nghĩa và ràng buộc, an toàn và toàn vẹn dữ liệu
Người quản trị nhìn thấy mức này
Internel (physical) level
Liên quan đến cách lưu trữ vật lý dữ liệu
Phần lớn user và quản trị hệ thống không quan tâm đến mức này.
View 1 View 2 View 3
Conceptual schema
Internal schema
Database
User 1 User 2 User 3
External level
Conceptual level
Internal level
ANSI-SPARC
Trang 6Data Access
Temporal models
User’s view
Distributed view
Conceptual data
view
Physical storage view
Trang 72.1 Kiến trúc cơ sở MMDBMS
Yêu cầu tổng quát đối với kiến trúc MMDBMS
Hỗ trợ các loại ứng dụng khác nhau
Dễ dàng thêm bớt, sửa đổi các mođun của hệ thống
Hỗ trợ phân tán trên nhiều servers, clients
MMDBMS có các khối chức năng chính sau:
Giao diện người sử dụng
Bộ trích chọn đặc trưng
Bộ quản lý truyền thông (trên clients và trên servers)
Môtơ chỉ mục và tìm kiếm
Bộ quản lý lưu trữ
Trang 8Kiến trúc cơ sở MMDBMS
Kiến trúc cơ sở của MMDBMS
thực hiện hai pha chính:
Chèn dữ liệu
Truy vấn thông tin
Pha chèn đối tượng
User chỉ ra tệp hay phác họa một
hay một nhóm Items thông qua UI
Tách tự động hay bán tự động
đặc trưng
Gửi dữ liệu gốc và các đặc trưng
đến server(s)
Các đặc trưng được tổ chức theo
lược đồ chỉ mục tại server(s)
Dữ liệu gốc và đặc trưng được
lưu trữ theo cấu trúc phù hợp
Giao diện Người sử dụng
Trang 9Kiến trúc cơ sở MMDBMS
Truy vấn thông tin
User hình thành câu truy vấn từ
bàn phím, chuột thông qua UI (từ tệp hay phác họa)
UI cho phép duyệt các Items trong
CSDL để chọn làm query
Trích chọn đặc trưng nếu cần
Gửi các đặc trưng đến server(s)
Tìm kiếm các Items phù hợp nhất
với đặc trưng truy vấn
Gửi các Item kết quả tới UI
UI hiển thị danh sách các kết quả
Trang 102.2 Lưu trữ dữ liệu trong MMDBMS
Cơ sở dữ liệu đa phương tiện
Cơ sở dữ liệu đặc trưng
Trích chọn các đặc trưng
Trích chọn các đặc trưng
Các đặc trưng đã được trích chọn
Truy vấn
Kết quả
Đo mức độ tương tự
Dữ liệu đa phương tiện
Xây dựng cơ sở dữ liệu
đa phương tiện
Dữ liệu truy vấn
Trang 11Kiến trúc hệ thống lưu trữ dữ liệu
Kiến trúc tự trị (autonomy)
Mỗi loại media (ảnh, âm thanh, văn bản và video) được nhóm
riêng và được lưu trữ theo cách riêng
Nhận xét
Tương tác giữa các loại media là phức tạp, đòi hỏi lập trình nhiều
Thích hợp cho sự kế thừa dữ liệu
User
Multimedia Query Engine
Document Index Image Index Audio Index Video Index
Trang 12Kiến trúc hệ thống lưu trữ dữ liệu
Kiến trúc đồng nhất (uniformity)
Hình thành cấu trúc dữ liệu trừu tượng với khả năng hỗ trợ chỉ
mục phần chung cho toàn bộ các kiểu media
Nhận xét
Dễ cài đặt, thuật toán chạy nhanh
Tương tác thuận tiện giữa các loại media vì có cùng cấu trúc dữ
Trang 13Kiến trúc hệ thống lưu trữ dữ liệu
Kiến trúc lai (hybrid)
Kết hợp 2 kiến trúc tự trị và kiến trúc đồng nhất
Một số kiểu dữ liệu sử dụng chỉ mục của riêng nó, một số khác
sử dụng theo kiến trúc uniformity
Nhận xét:
Tận dụng được ưu điểm
và giảm thiểu nhược điểm của 2 loại trên
Trang 143 Mô hình dữ liệu đa phương tiện
Mô hình dữ liệu?
Là mô hình trừu tượng đặc tả cách thức trình diễn và sử dụng
dữ liệu trong hệ thống
Xác định thông tin được tổ chức và lưu trữ như thế nào, hỗ trợ
loại truy vấn nào
Mô hình dữ liệu tốt?
Khả năng mở rộng để bổ sung kiểu dữ liệu mới
Khả năng trình diễn các kiểu đối tượng cơ sở và các đối tượng
tổ hợp với các quan hệ về không gian, thời gian phức tạp
tượng khác nhau
Cho khả năng lưu trữ, tìm kiếm hiệu quả
Tuân thủ chuẩn quốc tế để trao đổi, phân tán dữ liệu
Trang 153.1 Mô hình dữ liệu đa phương tiện
Vai trò của mô hình dữ liệu tổng quát là cung cấp khung
làm việc (hoặc ngôn ngữ) để người sử dụng có thể:
Biểu diễn thuộc tính dữ liệu được hệ thống lưu trữ và tìm kiếm
Cho khả năng định nghĩa, chèn, hủy, sửa đổi và tìm kiếm mục
dữ liệu và các thuộc tính dữ liệu
Với MMDBMS, mô hình dữ liệu còn bổ sung khả năng
Đặc tả, tính toán ở mức trừu tượng khác nhau trên dữ liệu đa
phương tiện
Thu thập các tính chất tĩnh và động của các mục dữ liệu
Tĩnh: đối tượng hình thành đa phương tiện, thuộc tính, quan hệ của chúng
Động: Tương tác giữa các đối tượng, giữa đối tượng và người sử dụng.
Hỗ trợ các kiểu media cơ bản, có khả năng hình thành các đặc
trưng bổ sung
Hỗ trợ trình diễn không gian đa chiều và thước đo khoảng cách
Trang 16Yêu cầu mô hình dữ liệu đa phương tiện
Mô hình dữ liệu đa phương tiện phải có khả năng mở
rộng để bổ sung loại dữ liệu mới
Có khả năng trình diễn kiểu dữ liệu cơ sở và và các đối
tượng phức hợp với các quan hệ thời gian và không gian phức tạp
Mềm dẻo để các mục dữ liệu có thể được đặc tả, truy
vấn và tìm kiếm ở các mức độ trừu tượng khác nhau
Cho phép lưu trữ và tìm kiếm hiệu quả.
Trang 17Không gian Thời gian Tổng hợp
Video
Tầng đối tượng
Tầng kiểu media
Tầng khuôn mẫu media
Ảnh Đồ họa
3.2 Mô hình dữ liệu MM tổng quát
Trang 18Mô hình dữ liệu đa phương tiện tổng quát
Tầng đối tượng
Đối tượng bao gồm một hay nhiều media Items với các quan hệ
không gian và thời gian xác định
Thí dụ: đối tượng là một trang slide bao gồm vài ảnh và audio kèm theo.
Nhiệm vụ: chỉ ra quan hệ không gian và thời gian giữa các
media
Tầng loại media
Bao gồm các loại media chung suy diễn từ lớp media trừu
tượng
Đặc tả đặc trưng và thuộc tính các media
Thí dụ: kích thước, biểu đồ màu, các đối tượng chính nó chứa
Tầng khuôn mẫu media
Đặc tả khuôn mẫu, trong đó dữ liệu được lưu trữ
Nhận xét
Chưa có chuẩn chung cho các tầng mô hình dữ liệu
Các ứng dụng MMDBMS chủ yếu là đặc thù, chỉ tập trung vào
Trang 193.3 Ví dụ mô hình video tổng quát
Trang 20Mô hình video tổng quát
Bao gồm 4 tầng:
Frame là các video và ảnh độc lập
Shot là tập các frames được ghi hình bằng camera trong một
lần bấm máy
Scene (sequence) là tập các shot có cùng ngữ nghĩa
Episode là tập các scenes trong trình tự cụ thể Là một đơn vị
sản phẩm (thí dụ, chương trình bản tin TV)
Các thuộc tính được gắn vào từng tầng video
Episode: gán dữ liệu như tiêu đề, tác giả, ngày tháng tạo lập và
các thông tin liên quan đến kiểu video như chương trình tin tức
Scene: chứa ngữ nghĩa chung chia sẻ giữa các shot của nó
Shot: được đặc trưng bởi các khung hình đại diện và các dữ liệu
như các đối tượng chính, ngày tháng và nơi bấm máy
Frame: chứa dữ liệu ảnh thô, thống kê ảnh như biểu đồ màu
Trang 214 Thiết kế giao diện người sử dụng
Người sử dụng giao tiếp, tương tác với MMDBMS thông
qua giao diện
UI xác định tính sử dụng được của hệ thống
UI hỗ trợ các công việc chính sau
Chèn các Items vào CSDL
Nhập câu truy vấn
Trình diễn kết quả truy vấn
Một UI tốt cần thỏa mãn các yêu cầu sau
Có công cụ để người sử dụng dễ dàng chèn các đối tượng dữ
liệu vào CSDL
Có công cụ để người sử dụng nhập câu truy vấn một cách hiệu
quả và thông báo cho hệ thống những thông tin mà nó cần
Trình diễn hiệu quả kết quả truy vấn
Thân thiện với người sử dụng
Trang 224.1 UI hỗ trợ thu thập dữ liệu
CSDL truyền thống
Bản ghi có cấu trúc cố định với tổng số thuộc tính cố định
Chèn bản ghi vào CSDL bằng ngôn ngữ SQL
Mục dữ liệu trong CSDL có thể có kiểu bất kỳ hay tổ hợp nhiều
kiểu media khác nhau
Không có cấu trúc và thuộc tính cố định
Do vậy, UI hỗ trợ user đặc tả kiểu đầu vào khác nhau, tổ hợp
các đối tượng MM và chỉ ra kiểu thuộc tính sẽ trích chọn và chỉ mục
UI hỗ trợ Query by Example.
Việc xử lý và trích chọn đặc trưng đòi hỏi nhiều tính toán,
Thời gian trích chọn từ (vài giây)/(đối tượng) đến (vài giờ)/(đối tượng phức tạp) như phim.
Do vậy, UI phải có khả năng đặc tả các thao tác trên “nhóm đối tượng” để
Trang 234.2 UI hỗ trợ tìm kiếm và duyệt
Tìm kiếm theo hai cách
Tìm kiếm theo đặc tả đặc trưng
Cho phép user sử dụng các từ khóa, tham số để đặc tả đặc trưng hay thuộc tính về nhu cầu thông tin.
Tìm kiếm theo ví dụ
“An image is worth a thousand words”
UI cần có các công cụ đầu vào khác nhau như micro, camera
Duyệt
Khi không biết chính xác cái muốn tìm kiếm
Ba phương pháp khởi đầu duyệt
Từ truy vấn không rõ ràng sau đó user duyệt các items trong kết quả
Thông tin trong CSDL được tổ chức theo vài tiêu chí nào đó (ngày tháng, chủ điểm) để user có thể duyệt theo các tiêu chí này
Chọn ngẫu nhiên một số items từ CSDL để duyệt Thực hiện lặp nếu chưa đáp ứng yêu cầu.
Biểu diễn Icon để duyệt hiệu quả
Trang 244.3 UI hỗ trợ làm mịn truy vấn
Thực hiện trên cơ sở phản
hồi thích hợp của kết quả khởi đầu
Thực tế:
Truy vấn thông tin đa
phương tiện là tiến trình tổ hợp của cả ba loại: tìm kiếm, duyệt và làm mịn
Trang 254.4 UI hỗ trợ trình diễn kết quả
Trình diễn mọi loại media và quản lý các quan hệ không
gian và thời gian của chúng.
Đảm bảo trình diễn audio, video dài và ảnh lớn
Khả năng trình diễn thông tin chính để user duyệt và chọn
Ảnh thumbnail hay biểu tượng phim là các công cụ đặc biệt
quan trọng
Thời gian đáp ứng hệ thống phải ngắn
Thời gian đáp ứng được xác định bởi phân hệ truyền tin và tìm
kiếm trong CSDL
Một kỹ thuật để có cảm giác giảm thời gian đáp ứng là giải mã
tăng dần (progressive) và hiển thị.
Hỗ trợ phản hồi liên quan và làm mịn truy vấn
Trang 26Ví dụ UI hỗ trợ trình diễn kết quả
Trang 27Ví dụ UI hỗ trợ trình diễn kết quả
Trang 28Ví dụ UI hỗ trợ trình diễn kết quả
Trang 295 Vấn đề trích chọn đặc trưng
Các đặc trưng và thuộc tính của các mục thông tin được
trích chọn, tham số hóa, tổ chức trong cấu trúc có chỉ
mục và lưu trữ cùng với các Items.
Các yêu cầu trích chọn đặc trưng
Đặc trưng phải được trích chọn đầy đủ nhất có thể để biểu diễn
nội dung của các mục thông tin
Phải được trình diễn và lưu trữ một cách chặt chẽ, mạch lạc
Không trích chọn đặc trưng phức tạp và đặc trưng lớn
Phải có khả năng tìm kiếm và so sánh nhanh các đối tượng với nhau.
Tính toán khoảng cách giữa các đặc trưng phải hiệu quả
Ngược lại, thời gian đáp ứng của hệ thống rất lớn.
Thông thường có bốn mức đặc trưng và thuộc tính
Metadata
Mô tả (annotation) bằng văn bản
Đặc trưng nội dung mức thấp
Đặc trưng nội dung mức cao.
Trang 305.1 Bốn mức của đặc trưng và thuộc tính
Meta-data
Bao gồm các thuộc tính như tên tác giả, ngày tạo lập, tiêu đề
Các thuộc tính này được quản lý bằng kỹ thuật DBMS
Mô tả bằng văn bản
Mô tả dưới hình thức nhiều từ khóa hay văn bản thông thường
Sử dụng kỹ thuật tìm kiếm thông tin văn bản (IR) để chỉ mục và
tìm kiếm
Nội dung mức thấp
Thu thập các mẫu dữ liệu, thống kê đối tượng, các quan hệ
không gian và thời gian giữa các bộ phận đối tượng
Mỗi media khác nhau có đặc trưng mức thấp khác nhau
Nội dung mức cao
Nhận dạng và hiểu đối tượng
Nhận dạng các đối tượng nhìn thấy còn rất khó khăn
Trang 315.2 Chỉ mục và thước đo tương tự
Cấu trúc chỉ mục
Nhu cầu tổ chức đặc trưng trong cấu trúc chỉ mục để tìm kiếm
hiệu quả sau khi trích chọn đặc trưng
Chỉ mục phân cấp và nhiều mức, bao gồm:
Truy vấn trên cơ sở tính tương tự thay cho đối sánh chính xác
Mức độ tương tự được tính toán trên cơ sở các đặc trưng dưới
dạng một hay nhiều giá trị
Kết quả truy vấn do con người quyết định
Độ đo tính tương tự rất phức tạp vì quyết định của người sử
dụng là chủ quan và thường phụ thuộc ngữ cảnh
Trang 326 Đảm bảo chất lượng dịch vụ (QoS)
Yêu cầu của MMDBMS (thông thường là phân tán)
Đòi hỏi băng thông rộng,
Không gian lưu trữ lớn
Tốc độ đường truyền cao
Giới hạn jiter, độ trễ
Đồng bộ không gian, thời gian
Khung làm việc (hay QoS) được đề xuất để đáp ứng yêu
cầu trên
QoS là tập các tham số yêu cầu Là hợp đồng giao kèo
giữa ứng dụng và hệ thống.
Các hình thức đảm bảo QoS
Thỏa mãn hoàn toàn QoS
Đảm bảo với xác suất nhất định p
Không đảm bảo: Ứng dụng thực hiện lâu tùy ý
Trang 33Đảm bảo chất lượng dịch vụ
Một hệ thống đa phương tiện điển hình bao gồm: Hosts
(bao gồm cả clients và servers) dưới điều khiển của OS,
bộ quản lý lưu trữ, hệ thống truyền tin và giao vận.
QoS được đảm bảo khi các tài nguyên hệ thống (ví dụ
chu kỳ CPU, bộ nhớ, băng thông ) được quản lý đúng đắn
Vấn đề nghiên cứu QoS đặt ra là:
Chuyển đổi các tham số QoS sang các yêu cầu tài nguyên
Phân chia các phiên làm việc để nhiều phiên làm việc đều được
đáp ứng bởi số lượng cố định tài nguyên
Trang 34Khung làm việc của QoS
- Jitter Delay
- Bandwidth
- Packet Loss Rate
- Storage Throughput/
Bandwidth
- Storage Delays
- Distributed Database Coordination (QoS)
- CPU Throughput
- Memory Overflow and Reliability
- Intrusion Detection
- Access Control
OS Network
End-to-End
Run Time
Trang 357 Nén dữ liệu
Nhiệm vụ nén dữ liệu
Mục tiêu chính của nén là làm giảm thiểu khối lượng lưu trữ
MMDBMS đòi hỏi nén/giải nén nhiều lần
Cần lựa chọn kỹ thuật nén sao cho chỉ mục và tìm kiếm trên dữ
liệu nén hiệu quả: DCT, lượng tử véctơ, wavelet
Chuyển đổi ảnh raster sang véctơ mỗi khi có thể
Nên sử dụng ảnh JPEG2000, MPEG-4 để dễ dàng có ảnh
thumbnail.
Trang 368 Kết luận
Nhiệm vụ và yêu cầu thiết kế của MMDBMS, bao gồm:
Mô hình và kiến trúc hệ thống
Mô hình hóa dữ liệu
Giao diện người sử dụng
Trích chọn đặc trưng
Chỉ số hóa, Đo độ tương tự đặc trưng
Đảm bảo QoS
Nén dữ liệu
Chuẩn hóa trình diễn dữ liệu
Xử lý truy vấn và truy tìm thông tin đa phương tiện
Trang 37Câu hỏi ôn tập
Mô tả kiến trúc tổng quát của MMDBMS
Mô tả vai trò mô hình dữ liệu trong MMDBMS, sự khác
biệt về yêu cầu mô hình dữ liệu của DBMS và
MMDBMS
Tại sao phải trích chọn đặc trưng dữ liệu MM?
Mô tả chức năng chính của UI trong MMDBMS
QoS là gì? Mô tả nguyên lý cơ bản của đảm bảo chất
lượng dịch vụ.
Trang 38Câu hỏi?