1. Trang chủ
  2. » Giáo án - Bài giảng

đề cương và đáp án môn CSDL đa PHƯƠNG TIỆN

30 1K 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 30
Dung lượng 1,41 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Câu hỏi 1.1: Hãy trình bày các khái niệm về phương tiện, đa phương tiện, các kiểu dữ liệu đa phương tiệnNhiều cách phân loại phương tiện: - Dựa trên format vật lý - Dựa trên mối quan hệ

Trang 1

MỤC LỤC – CSDL ĐA PHƯƠNG TIỆN

MỤC LỤC – CSDL ĐA PHƯƠNG TIỆN 1

Câu hỏi 1.1: Hãy trình bày các khái niệm về phương tiện, đa phương tiện, các kiểu dữ liệu đa phương tiện và cách phân loại 3

Câu hỏi 1.2: Hãy trình bày các đặc trưng của dữ liệu đa phương tiện 4

Câu hỏi 1.3: Hãy trình bày hiểu biết của anh/chị về hệ thống tìm kiếm thông tin văn bản IR 5

Câu hỏi 1.4: Hãy trình bày hiểu biết của anh/chị về ngôn ngữ thao tác dữ liệu đa phương tiện 5

Câu hỏi 1.5: Hãy trình bày các khái niệm cơ bản sử dụng trong mô hình hóa tư liệu đa phương tiện tương tác IMD 6

Câu hỏi 1.6: Hãy trình bày mô hình tổng quan hệ thống truy vấn thông tin đa phương tiện MIRS và các đặc tính mong muốn hỗ trợ bởi hệ thống 7

Câu hỏi 1.7: Hãy trình bày vai trò của DBMS và IR trong hệ thống truy vấn thông tin đa phương tiện MIRS 10

Câu hỏi 1.8: Hãy trình bày kiến trúc cặp lỏng của hệ thống truy vấn thông tin đa phương tiện 12

Câu hỏi 1.9: Hãy trình bày kiến trúc cặp chặt của hệ thống truy vấn thông tin đa phương tiện 13

Câu hỏi 1.10: Hãy trình bày kiến trúc theo lược đồ của hệ thống truy vấn thông tin đa phương tiện 13

Câu hỏi 1.11: Hãy trình bày kiến trúc theo chức năng của hệ thống truy vấn thông tin đa phương tiện 14

Câu hỏi 1.12: Hãy trình bày kiến trúc kiểu mở rộng của hệ thống truy vấn thông tin đa phương tiện 14

Câu hỏi 1.13: Hãy trình bày kiến trúc kiểu phân tán của hệ thống truy vấn thông tin đa phương tiện 15

Câu hỏi 1.14: Hãy trình bày kiến trúc kiểu liên động của hệ thống truy vấn thông tin đa phương tiện 15

Câu hỏi 1.15: Hãy trình bày vai trò và yêu cầu của mô hình dữ liệu ĐPT 16

Câu hỏi 1.16: Hãy nêu Mô hình biểu diễn dữ liệu đa phương tiện tổng quát 17

Câu hỏi 1.17: Hãy trình bày hiểu biết của anh chị về mô hình hóa dữ liệu đa phương tiện sử dụng mô hình quan hệ Cho ví dụ 17

Câu hỏi 1.18: Hãy trình bày hiểu biết của anh chị về mô hình hóa dữ liệu đa phương tiện sử dụng mô hình hướng đối tượng Cho ví dụ 18

Câu hỏi 1.19: Hãy trình bày hiểu biết của anh chị về mô hình hóa dữ liệu đa phương tiện sử dụng mô hình kết hợp hướng đối tượng-quan hệ Cho ví dụ 19

Câu hỏi 1.20: Hãy trình bày hiểu biết của anh chị về mô hình hóa dữ liệu đa phương tiện sử dụng mô hình siêu ngữ nghĩa Cho ví dụ 20

Câu hỏi 1.22: Hãy trình bày hiểu biết của anh/chị về tìm kiếm theo đặc trưng nội dung đa phương tiện 21

Câu hỏi 1.23: Hãy trình bày hiểu biết của anh/chị về tìm kiếm dữ liệu đa phương tiện dựa trên siêu dữ liệu metadata 22

Câu hỏi 2.3: Hãy trình bày hiểu biết của anh chị về cây k-D tổng quát 23

Câu hỏi 2.5: Hãy trình bày hiểu biết của anh chị về cây tứ phân MX 25

Câu hỏi 2.6: Hãy trình bày hiểu biết của anh chị về cây tứ phân PR 26

Câu hỏi 2.7: Hãy trình bày hiểu biết của anh chị về cây R 27

Câu hỏi 2.8: Hãy so sánh DBMS và IR 29

Câu hỏi 2.9: Hãy so sánh cách tiếp cận trong tìm kiếm dữ liệu đa phương tiện dựa trên đặc trưng nội dung và cách tiếp cận dựa trên siêu dữ liệu metadata 30

Câu hỏi 2.10: Hãy trình bày các bước của quá trình đánh chỉ mục tự động dữ liệu text 30

Trang 3

Câu hỏi 1.1: Hãy trình bày các khái niệm về phương tiện, đa phương tiện, các kiểu dữ liệu đa phương tiện

Nhiều cách phân loại phương tiện:

- Dựa trên format vật lý

- Dựa trên mối quan hệ phương tiện với thời gian:

+ Phương tiện tĩnh (static media): Không có chiều thờigian: Nội dung và ý nghĩa của phương tiện không phụthuộc thời gian

+ Phương tiện động (dynamic media): Có chiều thờigian: Nội dung, ý nghĩa và độ chính xác phụ thuộc và tốc

độ phương tiện được hiển thị

Đa phương tiện (multimedia):Một tập các loại phương tiệnđược dùng với nhau

Dữ liệu đa phương tiện: Là các biểu diễn có thể đọc đượcbởi máy tính của các loại phương tiện

- Dữ liệu văn bản (có hoặc không có định dạng)

- Đồ họa: là các bản vẽ, minh họa được mã hóa như các

tệp postscript

Trang 4

• Dữ liệu multimedia, nhất là âm thanh và video, là dữliệu

có sốlượng lớn Ví dụ, 1 video 10’ trung bình chiếm 1,5GBchưa nén

• Âm thanh và video có chiều thời gian và chúng khi biểudiễn sẽchiếm tỷlệcố định đểhoạt động có hiệu quả như đãyêu cầu

• Âm thanh số, ảnh và video được trình diễn theo một loạtgiá trị đơn cá thểvà thiếu cấu trúc ngữ nghĩa rõ ràng chomáy tính đểtự động hoá nhận biết nội dung

• Nhiều ứng dụng multimedia đòi hỏi việc biểu diễn đồngthời các kiểu truyền thông đa năng theo cách kết hợp khônggian và thời gian

• Ý nghĩa của dữ liệu multimedia đôi khi rất mờ và có tínhchủ quan Ví dụ, mỗi người có cách giải thích cùng 1 bứctranh theo cách khác nhau hoàn toàn riêng

• Dữ liệu multimedia là giàu vềthông tin, nhiều tham sốđược đòi hỏi mới biểu diễn đủ nội dung của nó

Trang 5

Câu hỏi 1.3: Hãy trình bày hiểu biết của anh/chị về hệ thống tìm kiếm thông tin văn bản IR

Text Document Information Retrieval (IR): Quản lý và lưutrữ dung lượng lớn các tài liệu văn bản

IR tập trung vào truy vấn tài liệu văn bản

Các kỹ thuật IR đóng vai trò quan trọng trong quản lý thôngtin ĐPT

– Số lượng lớn các tài liệu văn bản ở các tổ chức

– Văn bản được dùng để chú giải các loại dữ liệu ĐPT khácTuy nhiên việc dùng các kỹ thuật IR trong xử lý thông tinĐPT có hạn chế:

– Việc chú giải là quá trình thủ công, tốn thời gian

– Việc chú giải là không đầy đủ và mang tính chủ quan

– Các ký thuật IR không thể xử lý các câu truy vấn dạngkhác văn bản

– Một vài đặc điểm đa phương tiện khó mô tả bằng văn bản(image texture, object shapes)

Câu hỏi 1.4: Hãy trình bày hiểu biết của anh/chị về ngôn ngữ thao tác dữ liệu đa phương tiện

(chỉ tìm đc thao tác vs dữ liệu bt thôi, k có đa phương tiện)

Ngôn ngữ thao tác dữ liệu DML (Data ManipulationLanguage) hay còn gọi là ngôn ngữ vấn tin (QueryLanguage) dùng để thao tác trên các quan hệ CSDL, baogồm một số phép toán, các toán hạng là các quan hệ và kết

Trang 6

quả của các phép toán cũng là một quan hệ Ngôn ngữ thaotác dữ liệu gồm 2 nhóm phép toán:

a) Nhóm các phép toán lưu trữ:

♦ Chèn thêm: Chèn vào CSDL từ vùng làm việc đệm

chứa các thông tin về một bản ghi cụ thể

♦ Xoá: Xoá một bộ hay xoá một nhóm các bộ.

♦ Sửa đổi: Sửa đổi giá trị của một số thuộc tính.

b) Nhóm các phép toán tìm kiếm gồm:

♦ Phép chọn SELECT: Tạo ra một quan hệ mới, các bộ

được rút ra một cách duy nhất từ các bộ của quan hệ nguồnthoả mãn một tân từ xác định

♦ Phép chiếu PROJECT: Tạo ra một quan hệ mới, các

thuộc tính được rút ra, hoặc được biến đổi từ các thuộc tínhcủa quan hệ nguồn, các bộ là các bộ của quan hệ nguồn bỏ

đi những bộ trùng lặp

♦ Phép kết nối JOIN: Nhằm tạo ra một quan hệ mới,

bằng cách nối nhiều quan hệ trên miền thuộc tính chung.Các thuộc tính của quan hệ kết quả là các thuộc tính của cácquan hệ thành viên và các bộ là ghép nối các bộ của quan

hệ nguồn có cùng chung giá trị thuộc tính chung

Câu hỏi 1.5: Hãy trình bày các khái niệm cơ bản sử dụng trong mô hình hóa tư liệu đa phương tiện tương tác IMD

Trang 7

• Mô hình đối tượng: Phản ánh được các cấu trúc dữ liệuphức tạp

• Mô hình quan hệ: Phản ánh được mối quan hệ giữa cácđối tượng

Thuộc tính: một tính chất riêng biệt của một đối tượng

- Tên

- Kiểu, miền giá trị

Quan hệ: được định nghĩa trên một tập các thuộc tính

Bộ giá trị: các thông tin của một đối tượng thuộc quan hệ Khoá:

Các phép toán: hợp, giao, tích đề-các, lựa chọn, chiếu, kết

Các thao tác MIRS đợc mô tả trên hình 1 2 Dữ liệu(các mục thông tin) trong CSDL được tiền xử lý để tríchchọn đặc trưng và nội dung ngữ nghĩa Sau đó chúngđược chỉ số hóa trên cơ sở đặc trưng và ngữ nghĩa

Trong khi truy tìm thông tin, câu truy vấn của người

sử dụng được xử lý và các đặc trưng chính của nó đượctrích chọn Các đặc trưng này sau đó được so sánh với các

Trang 8

đặc trưng hay chỉ mục của mỗi mục thông tin trongCSDL Các mục thông tin nào có đặc trưng gần giốngnhất với các đặc trưng của câu truy vấn thì được tìm ra vàtrình diễn cho người sử dụng.

Mẫu truy vấn có thể mô tả như sau:

Chỉ mục:

Anh (I) > véctơ đặc trưng f(I): (fi, f2, fk)

Trang 9

khả năng mong đợi và các ứng dụng của mirs

Truy vấn trên cơ sở meta-data

Truy vấn trên cơ sở mô tả

Truy vấn trên cơ sở mẫu (pattern) hay đặc trưngTruy vấn theo thí dụ (by example)

Truy vấn ứng dụng cụ thể

Trang 10

Câu hỏi 1.7: Hãy trình bày vai trò của DBMS và IR trong hệ thống truy vấn thông tin đa phương tiện MIRS

 Vai trò của DBMS (Hệ quản trị cơ sở dữ liệu) trongtruy vấn thông tin ĐPT:

- Các hệ quản trị CSDL đã được phát triển và sử dụngrộng rãi đối với dữ liệu có cấu trúc

- Trong hệ quản trị CSDL quan hệ, thông tin được tổchức dưới dạng các bảng và quan hệ Các hàng của bảngtương ứng với các đơn vị thông tin hoặc bản ghi Các cộttương ứng với các thuộc tính

- SQL được sử dụng để thao tác trên CSDL

- Các thuộc tính trong hệ quản trị CSDL quan hệ có kiểu

cố định và có kích cỡ cố định Hệ quản trị CSDL quan hệphù hợp với việc xử lý các dữ liệu kiểu chữ số và các xâu

ký tự ngắn

- Loại dữ liệu lớn có độ dài biến đổi được hỗ trợ trong

hệ quản trị CSDL quan hệ là đối tượng rộng hoặc nhị phân(BLOB)

- Hệ quản trị CSDL hướng đối tượng

+ Kết nối các đặc điểm hướng đối tượng với CSDL quanhệ

+ Các đối tượng được định nghĩa theo kiểu hướng đốitượng Mỗi đối tượng chứa các thuộc tính và phương thức

- BLOBs và các đối tượng là một bước tiếp cận đến xử

lý dữ liệu ĐPT

Trang 11

- BLOBs chỉ lưu trữ dữ liệu có khối lượng lớn, còn đốitượng chứa các thuộc tính đơn giản dẫn đến một số yêu cầu

để xử lý truy vấn dữ liệu ĐPT như sau:

+ Các công cụ tự động hoặc bán tự động trích chọn cácnội dung và đặc trưng chứa trong dữ liệu ĐPT

+ Cấu trúc đánh chỉ mục đa chiều để xử lý các vector đặctrưng

+ Các độ đo tương đồng để truy vấn thông tin ĐPT thay

 Vai trò của IR trong truy vấn thông tin ĐPT

- IR tập trung vào truy vấn tài liệu văn bản

- Các kỹ thuật IR đóng vai trò quan trọng trong quản lýthông tin ĐPT bởi:

+ Tồn tại một lượng lớn các tài liệu văn bản ở các dạng tổchức, ví dụ như thư viện

+ Văn bản được dùng để chú giải các loại dữ liệu ĐPTkhác

- Tuy nhiên, việc dùng các kỹ thuật IR trong xử lý thôngtin ĐPT có hạn chế:

+ Việc chú giải là quá trình thủ công, tốn thời gian

+ Việc chú giải là không đầy đủ và mang tính chủ quan+ Các kỹ thuật IR không thể xử lý các câu truy vấn dạngkhác văn bản

Trang 12

+ Một vài đặc điểm ĐPT khó mô tả bằng văn bản (kết cấuảnh, hình thù đối tượng )

Câu hỏi 1.8: Hãy trình bày kiến trúc cặp lỏng của hệ thống truy vấn thông tin đa phương tiện

- DBMS quản lý metadata

- Thành phần quản lý tệp tin ĐPT quản lý dữ liệuĐPT

- Modul tích hợp DBMS và thành phần quản lý tệptin ĐPT

Ưu điểm:

- Tận dụng hệ thống quản lý tệp tin đpt khác nhau

để quản lý dữ liệu đpt

Trang 13

Câu hỏi 1.9: Hãy trình bày kiến trúc cặp chặt của hệ thống truy vấn thông tin đa phương tiện

+ Hệ quản trị CSDL ở đây quản lý dữ liệu đa phương tiện

+ Quản lý bảo mật toàn vẹn

Câu hỏi 1.10: Hãy trình bày kiến trúc theo lược đồ của

hệ thống truy vấn thông tin đa phương tiện

- Lược đồ là metadata mô tả dữ liệu dpt trong CSDL

Trang 14

- Lược đồ trong: cấu trúc dữ liệu bên trong

- Mỗi lược đồ có các cách biểu diễn khác nhau

- Mappings thực hiện chuyển đổi từ biểu diễn này sangbiểu diễn khác

Câu hỏi 1.11: Hãy trình bày kiến trúc theo chức năng của hệ thống truy vấn thông tin đa phương tiện

(hình tiếng anh, cho vào cũng vậy)

Câu hỏi 1.12: Hãy trình bày kiến trúc kiểu mở rộng của

hệ thống truy vấn thông tin đa phương tiện

(hình tiếng anh, cho vào cũng vậy)

Trang 15

Câu hỏi 1.13: Hãy trình bày kiến trúc kiểu phân tán của

hệ thống truy vấn thông tin đa phương tiện

Câu hỏi 1.14: Hãy trình bày kiến trúc kiểu liên động của

hệ thống truy vấn thông tin đa phương tiện

(hình tiếng anh, cho vào cũng vậy)

Trang 16

Câu hỏi 1.15: Hãy trình bày vai trò và yêu cầu của mô hình dữ liệu ĐPT

• Vai trò:

– Cung cấp khuôn khổ (ngôn ngữ) để diễn đạt các

thuộc tính của các thực thể dữ liệu

– Cho phép thực hiện các thao tác định nghĩa, chèn, xóa,thay đổi và tìm kiếm các thực thể và các thuộc tính của

cơ sở dữ liệu

• Các yêu cầu chính đối với mô hình dữ liệu ĐPT

• Mô hình dữ liệu phải có tính mở rộng để các loại

dữ liệu mới có thể được bổ xung

• Mô hình dữ liệu phải có khả năng biểu diễn các loại

đữ liệu cơ bản và phức tạp cũng như cácmối quan hệ phức tạp về không gian/thời gian

• Mô hình dữ liệu phải đủ linh hoạt để các thực

thể dữ liệu có thể được xác định, thể dữ liệu có thểđược xác định, truy vấn và tìm

kiếm ở các mức trừu tượng khác nhau

• Mô hình dữ liệu phải cho phép việc lưu trữ và

tìm kiếm một cách hiệu quả

Trang 17

Câu hỏi 1.16: Hãy nêu Mô hình biểu diễn dữ liệu đa phương tiện tổng quát

Câu hỏi 1.17: Hãy trình bày hiểu biết của anh chị về mô hình hóa dữ liệu đa phương tiện sử dụng mô hình quan hệ Cho ví dụ.

Xây dựng một mô hình dữ liệu MULTIMEDIA trên nềntảng của mô hình dữ liệu của một CSDL truyền thống(thường là CSDL quan hệ hoặc CSDL hướng đối tượng)

Trang 18

MULTIMEDIA Các vấn đề nẩy sinh với cách tiếp cận này

là các cấu trúc bên dưới (của CSDL truyền thống) khôngđược thiết kế dành cho dữ liệu MULTIMEDIA, hơn nữa sựkhác biệt cơ bản các yêu cầu của một CSDL truyền thốngđối với MDB khiến cho giao diện trở thành nơi nghẽn cổchai trong toàn bộ hệ thống

Câu hỏi 1.18: Hãy trình bày hiểu biết của anh chị về mô hình hóa dữ liệu đa phương tiện sử dụng mô hình hướng đối tượng Cho ví dụ.

Mô hình dữ liệu hướng đối tượng ra đời vào khoảng nhữngnăm 90

Biểu diễn bằng sơ đồ lớp

Các khái niệm cơ bản:

- Đối tượng: một đối tượng trong thế giới thực, được xác

định bởi một định danh duy nhất

- Thuộc tính: biểu diễn một đặc tính của đối tượng,

- Phương thức : thao tác được thực hiện trên đối tượng

Tất cả các truy nhập vào thuộc tính của đối tượng đềuphải được thực hiện thông qua các phương thức này

- Lớp: một cách thức để khai báo một tập các đối tượng

có chung một tập thuộc tính và phương thức

Nhận xét:

• Ưu điểm

- Cho phép định nghĩa kiểu đối tượng phức tạp

- Tính chất: bao đóng (encapsulation), kế thừa (heritage),

Trang 19

Mô hình đối tượng: phản ánh được các cấu trúc dữ liệuphức tạp.

Mô hình quan hệ: Phản ánh được mối quan hệ

Trang 20

Câu hỏi 1.20: Hãy trình bày hiểu biết của anh chị về mô hình hóa dữ liệu đa phương tiện sử dụng mô hình siêu ngữ nghĩa Cho ví dụ.

Phản ánh được các luật ràng buộc giữa các loại phươngtiện

Biểu diễn các ràng buộc/luật về thời gian

Vậy ta có: A play before B

( nói chung chả hiểu giề, tài liệu ko có trên mạng có 1tẹo trong tài liệu của thầy ở đây)

Trang 21

Câu hỏi 1.22: Hãy trình bày hiểu biết của anh/chị về tìm kiếm theo đặc trưng nội dung đa phương tiện

Việc truy vấn trên cơ sở hai loại đặc trưng nội dung mứcthấp và mức cao gọi là

truy vấn trên cơ sở nội dung

Đặc trưng nội dung mức thấp: Thu thập các mẫu vàthống kê đối tượng đa phương tiện và các quan hệ khônggian, thời gian giữa các phần đối tượng Mỗi media khácnhau có các đặc trưng nội dung mức thấp khác nhau

- Với âm thanh, đặc trưng mức thấp bao gồm âm lượngtrung bình, phân bổ tần số và tỷ lệ câm

- Các đặc trưng mức thấp của ảnh bao gồm phân bổ màu,texture, hình dạng đối

tượng và cấu trúc không gian

- Đặc trưng mức thấp của video bao gồm cấu trúc thời gian Lợi thế chính của việc sử dụng đặc trưng mức thấp là cóthể tự động trích chọn chúng

Đặc trưng nội dung mức cao: Cố gắng nhận biết và hiểu đốitượng Ngoài nhận

dạng văn bản và tiếng nói, việc nhận dạng và hiểu đoạn âmthanh hay các đối tượng nhìn là rất khó khăn Trong ứngdụng với hữu hạn các đối tượng, việc mô tả và nhận biếtcác đặc trưng chung là rất hiệu quả Ví dụ, dự báo tới 95%các video có mục tiêu chính là quay người hay nhóm người

Nó hữu ích cho các hệ thống để nhận biết và diễn giải liên

Ngày đăng: 01/07/2016, 07:15

TỪ KHÓA LIÊN QUAN

w