1. Trang chủ
  2. » Công Nghệ Thông Tin

slike bài giảng cơ sở dữ liệu đa phương tiện - nguyễn thị oanh chương 1 các khái niệm cơ bản

59 954 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 59
Dung lượng 1,34 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Kiểu Media  Phân loại: – Theo định dạng vật lý – Theo mối liên hệ với thời gian:  Media tĩnh static media: nội dung và ý nghĩa không phụ thuộc vào biểu diễn thời gian: văn bản, ảnh tĩn

Trang 2

Giới thiệu chung

DL lớn

Khả năng tính

toán/lưu trữ

lớn

Nhu cầu chia sẻ/khai thác

Trang 3

Nội dung

1. Khái niệm cơ bản

2. Dữ liệu đa phương tiện

3. MIRS & MM - DBMS

4. Một ví dụ về ứng dụng đa phương tiện

5. Ứng dụng đa phương tiện

Trang 4

1 Khái niệm cơ bản

Trang 5

Kiểu Media

 Các kiểu thông tin và biểu diễn thông tin: văn bản, hình ảnh, đồ họa, vidéo, … và tất cả các thông tin có thể biểu diễn, lưu trữ, truyền, xử lý dưới dạng số

Trang 6

Kiểu Media

 Phân loại:

– Theo định dạng vật lý

– Theo mối liên hệ với thời gian:

 Media tĩnh (static media): nội dung và ý nghĩa không phụ thuộc

vào biểu diễn thời gian: văn bản, ảnh tĩnh, đồ họa

 Media động (dynamic media, continuous media ou isochronous

media): các dữ liệu có chiều thời gian: hoạt hình, âm thanh, video)

Trang 7

tập hợp các kiểu media được sử dụng cùng nhau, và

trong đó có ít nhất một kiểu dữ liệu không phải là DL

dạng văn bản: hoạt hình, âm thanh, video

Có thể coi là tổ hợp của văn bản, âm thanh, ảnh tĩnh,

ảnh động, video và các hình thức tương tác nội dung

Trang 8

Multimedia

Digital environment

USER

Elements of Multimedia

Trang 9

– biểu diễn của các kiểu dữ liệu media khác nhau mà máytính có thể đọc được

– là tập có cấu trúc nhất định các dữ liệu đa phương tiện

– một hệ đa phương tiện là hệ thống có khả năng xử lý dữliệu đa phương tiện và các ứng dụng

Trang 10

2 Dữ liệu đa phương tiện

Trang 11

Multimedia Data

 DL dạng văn bản (text):

– Chứa thông tin chủ đạo

Input: bàn phím, các chương trình nhận dạng âm thanh và ký tự,

dữ liệu lưu trên đĩa, phụ đề phim, …

Trang 12

Kích thước lưu trữ: không đáng kể so với các dữ liệu

đa phương tiện khác

Trang 13

– Dễ sửa đổi (khác với ảnh)

Input : trình soạn thảo đồ họa (Adobe Illustrator, Autocad, ) hoặc bởi các chương trình khác (Postscript)

Chuẩn đồ họa : OpenGL, PHIGS, GKS

Lưu trữ: file lưu trữ tập các đối tượng cơ bản (primitive),

kích thước không quá lớn

Trang 15

Kích thước lưu trữ : phụ thuộc vào kích thước ảnh, độ

phân giải, kỹ thuật nén (nếu có)

 1 bit / 1 pixel (ảnh nhị phân)

 8 bits/ 1pixel (ảnh đa mức xám)

 24 bits / 1pixel (ảnh màu)

– Ảnh thường được nén để giảm không gian lưu trữ

Trang 17

Multimedia Data ( )

 DL âm thanh:

– Tín hiệu âm thanh là tín hiệu tương tự và liên tục

Input : microphone  số hóa và lưu trữ

Không gian lưu trữ lớn :

 CD Quality Audio : 16-bit sampling at 44.1 KHz

 1 phút của 1 Mono CD (chưa nén): 5Mb

 1 phút của Stereo CD (chưa nén) : 10Mb

Thường được nén lại để giảm kích thước (mp3, aac,

Flac, Ogg Vorbis, …)

Trang 19

Không gian lưu trữ : tốn nhất

 Tùy thuộc và độ phân giải và kích thước, 1 khung hình có thể cần 1MB

 Video 512 x 512 đơn sắc : 25 x 0.25 = 6.25 Mb/1giây (chưa nén)

 PAL video (720x 576 pixel / khung màu) : 1.2 x 25 = 30Mb/giây (chưa nén)

 High Definition DVD (1440 x1080 = 1.5 Megapixels/frame) : 4.5 x

25 = 112.5Mb /giây (chưa nén)

Trang 20

Đặc điểm của DL đa phương tiện

 Kích thước DL lớn  cấu trúc DL đặc biệt: lưu trữ và đánh chỉ mục

 Có chiều thời gian (audio, vidéo)

 DL được biểu diễn thông qua chuỗi các giá trị riêng lẻ,

thiếu cấu trúc ngữ nghĩa rõ ràng để máy tính có thể

« hiểu » nội dung

 Nhiều ứng dụng yêu cầu biểu diễn nhiều kiểu DL đồng thời có thông số thời gian và không gian

 Ngữ nghĩa: mờ và chủ quan: cùng 1 bức ảnh, 2 người

có thể hiểu theo 2 cách khác nhau

 Giàu thông tin: cần nhiều tham số để có thể biểu diễn được nội dung

Trang 21

Challenges from MM Data

 Biểu diễn nội dung:

– Độ tin cậy, ngữ nghĩa phương pháp: tự động hoặc/vàthủ công

 Biểu diễn câu hỏi/ câu trả lời: biểu diễn DL phức hợp

 DL lớn => vấn đề lưu trữ, truy nhập và truyền

 Thời gian truy vấn (audio, video)

 Trích chọn thuộc tính tự động và đánh chỉ mục

Trang 22

3 MIRS & MM-DBMS

Trang 23

Phương pháp truy vấn dữ liệu

DL có cấu trúc

Information Retrieval (IR) system:

– tìm kiếm dữ liệu trong tập văn bản lớn

– biểu diễn nội dung: từ khóa, tóm tắt

– truy vấn: từ khóa, ngôn ngữ tự nhiên

– dựa trên đặc trưng của DL (ảnh, video, ): màu sắc, hìnhdạng, kết cấu, …

– Hiệu năng IR >> CBR do keyword có thể diễn tả ngữnghĩa

Trang 25

Need for MIRS

 DL đa phương tiện:

– ngày càng được thu thập và lưu trữ nhiều

 Máy tính cá nhân

 Internet: flickr, picassa, youtube, facebook, …

– có các đặc điểm đặc biệt so với dữ liệu số truyền thống

 DBMS truyền thống không phù hợp để xử lý

 Các kỹ thuật IR có thể hỗ trợ nhưng không đủ để xử lý

DL ĐPT hiệu quả

MIRS: Multimedia Information Retrieval System

MIRS = DBMS + IR + Content-based retrieval

Trang 26

trích chọn đặc trưng/biểu diễn nội dung

MIRS hoàn chỉnh == MM-DBMS

Trang 27

MIRS – Mô hình

Trang 29

Dựa trên hệ quản lý

file của HĐH

MediaWay, JASMINE, ITASCA

kiểu đối tượng phức tạp ORDBMS mở rộng Mid 90s

Oracle 10g, IBM DB2 UDE, IBM Informix

Dựa trên chuẩn MPEG-7, MPEG-21

MARS project (1998), MPEG-7 Multimedia Data Cartridge (2003)

Trang 30

– Bắt đầu thành công: 1996-1998, bắt đầu Informix

Commercial: Oracle 10g, IBM DB2 Universal Database

Extenders, IBM Informix

Research project: MIRROR (1999), DISIMA (2000)

Trang 31

– Đề cập nội dung ngữ nghĩa

Dựa trên chuẩn MPEG-7, MPEG-21

 MPEG-7: chuẩn cho mô tả DL ĐPT, XML-based

 MPEG-21: định nghĩa mô hình ĐPT mở

MARS project (1998)

MPEG-7 Multimedia Data Cartridge (MDC) (2003) : mởrộng của Oracle 9i

Trang 33

 allows concurrent transactions

Trang 34

 Access and authorization control

 Ensures database consistency between transactions

 Failures of transactions should not affect the persistent data storage

Trang 35

MM-DBMS – các yêu cầu

 Ngoài ra, với MM-DBMS phải đảm bảo:

truy vấn dữ liệu đồng nhất với các DL có định dạng khác

nhau

– truy vấn đồng thời từ nhiều nguồn

Hỗ trợ truy vấn (query support)

– truy xuất các đối tượng từ các thiết bị lưu trữ mà không

có bị rung/giật (video, audio)

Hỗ trợ lưu trữ (storage support)

có thể biểu diễn, truyền tải câu trả lời dưới dạng phương

tiện nghe nhìn, đảm bảo các yêu cầu QoS

Hỗ trợ trình diễn và truyền DL

Trang 36

Một số vấn đề chính: Hỗ trợ truy vấn

Ngôn ngữ truy vấn:

Cho phép dễ dàng truy vấn đến CSDL đa phương tiện:

– Hỗ trợ các phép toán trên các kiểu DL khác nhau

– Có khả năng truy nhập siêu DL mô tả nội dung từ các nguồn khác nhau

– Kết hợp kết quả truy vấn từ các nguồn khác nhau

Cho phép truy vấn hiệu quả

– Giải thuật truy vấn tối ưu?

– Nên đánh chỉ số các loại dữ liệu đa phương tiện như thế nào ?

Trang 37

Một số vấn đề chính: Mô tả nội dung

 Nội dung gì và mô tả bằng gì (từ khóa hay nội dung)

Trích chọn đặc trưng và biểu diễn nội dung thế nào từ:– ảnh

– Video

– Audio

– Văn bản có cấu trúc / phi cấu trúc

Đánh chỉ mục (indexing) các nội dung này thế nào ?

 Đo độ tương tự?

 Giải thuật cho phép truy vấn hiệu quả ?

Trang 38

Dữ liệu được ghi trên các thiết bị như thế nào?

 Thiết kế các máy chủ chứa thiết bị lưu trữ nhằm thỏa mãncác yêu cầu (tgian truy cập dài, đáp ứng thời gian thực) khithao tác khác nhau đồng thời từ phía người dùng trên

Trang 39

Một số vấn đề chính:Trình diễn và truyền DL

 Làm thế nào để trình chiếu nội dung của dữ liệu?

– Định dạng về không gian/ thời gian

 Làm thế nào để truyền phát dữ liệu đến người sử dụng khi:– Có nhu cầu tương tác với máy chủ ở xa để tập hợp các thành

Trang 40

– MOQL (97): Multimedia Object Query Language

– CSQL(98): Cognition and Semantics-based Query Language

– MRML(2000): Multimedia Retrieval Markup Language

– MQF(2007): Multimedia Query Format (a standard communication

language for querying multimedia databases)

Overview: Efficient multimedia query-by-content from mobile devices 2010

Trang 41

4 Ví dụ một ứng dụng đa

phương tiện

Trang 42

Các nguồn DL

Cuộc điều tra của công an về hoạt động ma túy trên diện rộng

Trang 43

Các nguồn DL

 Cuộc điều tra này sẽ dựa trên các thông tin sau:

Surveillance video: các camera sẽ thu thập thông tin về các hoạt động đáng nghi liên quan đến ma túy tại một số địa điểm Audio data: được thu âm từ các cuộc gọi điện thoại

Image data: Các ảnh được chụp bởi một số nhà điều tra

Document data: dữ liệu ghi chép trong lúc điều tra

Relational data: chứa các thông tin chung, dữ liệu ngân

hàng, … đối tượng nghi vấn

Geographic info.: các dữ liệu địa lý nơi mà các hoạt động điều tra được tiến hành

Trang 44

Truy vấn trong thư viện ảnh

 Ngữ cảnh 1:

– Cảnh sảt có ảnh của 1 đối tượng và muốn định danh

– Q1: Tìm tất cả các ảnh từ thư viện giống với ảnh đang có

Trang 45

Truy vấn trong thư viện ảnh

 Ngữ cảnh 2:

– Kiểm tra bức ảnh của JP

– Q2: Tìm tất cả các bức ảnh trong thư viện có hình củaJP

Trang 46

– ? Đối tượng ảnh liên kết với giá trị thuộc tính

– ? Đánh chỉ mục và tìm kiếm hiệu quả các thuộc tính

Trang 47

Truy vấn DL âm thanh

Trang 48

Truy vấn DL âm thanh

Trang 50

– Phỏng đoán: có thể người bị tấn công (A) quen biết thủ phạm

Q: Tìm tất cả các đoạn video mà có mặt người bị tấncông

Trang 51

Truy vấn hỗn tạp

phương tiện khác nhau

Khó, thậm chí trong trường hợp chỉ có DL văn bản

Trang 52

Truy vấn hỗn tạp – VD1

 Ví dụ truy vấn DL văn bản (HQ1): Tìm tất cả những kẻ

– đã bị kết án trong vụ tấn công ở Nam Phi và

– đã có chuyển khoản vào tài khoản của họ từ công ty ABC

 Vấn đề:

– Việc tìm kiếm tất cả những kẻ đã bị kết án do các tộikhác nhau có sẽ cần truy cập đến nhiều CSDL đa dạng

thuộc vào các phán xử, tòa án khác nhau

– Cty ABC có thể có nhiều tài khoản ở hàng trăm ngânhàng trên thế giới (định dạng khác nhau, hệ csdl khácnhau)

Trang 53

Truy vấn không thuần nhất – VD1

Trang 54

Truy vấn hỗn tạp – VD2

 Ví dụ truy vấn (HQ2): Tìm tất cả những kẻ

– đã bị kết án trong vụ tấn công ở Nam Phi và

– đã có chuyển khoản vào tài khoản của họ từ công ty ABC

– có chụp chung hình với Jose

Trang 55

Truy vấn không thuần nhất – VD2

Trang 56

5 Ứng dụng đa phương tiện

Trang 58

Ứng dụng

IBM’s MARVEL (Multimedia Analysis and Retrieval):

Searching service đang thử nghiệm:

(automatic and semi-automatic description generation)

http://www.alphaworks.ibm.com/tech/marvels

Discovir: Distributed Content-based Visual Information Retrieval System

http://appsrv.cse.cuhk.edu.hk/~miplab/discovir/

Ngày đăng: 24/10/2014, 10:03

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm