Bài báo cáo tìm kiếm dữ liệu video thuộc bộ môn cơ sở dữ liệu đa phương tiện Cơ Sở dữ liệu đa phương tiện: là một tập hợp các dữ liệu đa phương tiện có liên quan với nhau. Sinh viên báo cáo Cầm Văn Hoan Lớp K54 Đại Học Công Nghệ Thông Tin Trường Đại Học Tây Bắc Khoá học: 2013 2017
Trang 1BÀI BÁO CÁO
TÌM KIẾM DỮ LIỆU VIDEO
Bộ môn: Cơ sở dữ liệu đa phương tiện
Trang 2THÀNH VIÊN TRONG NHÓM
Cầm Văn Hoan
Lò Ngọc Anh
Tếnh Lão Bua
Lò Văn Dương
Lương Quốc Đức
Trang 3Đinh nghĩa về cơ sở dữ liệu đa phương tiện
Cơ Sở dữ liệu đa phương tiện: là một tập hợp các dữ liệu đa phương tiện có liên
quan với nhau Các kiểu dữ liệu thông thường của một CSDL đa phương tiện
gồm có:
- Văn bản: có mặt hầu hết ở các ứng dung đa phương tiện nhằm giải thích thêm
cho các dạng dữ liệu không phải là văn bản, đây là loại dữ liệu đa dạng, và
được lưu trữ nhỏ gọn nhất.
Trang 4- Audio: là loại dữ liệu phổ biết nhất cùng với nhiều định dạng khác nhau ( mp3,
mp4, wav, wma, cd, ra,…) File audio chưa chuyển hóa sang dang số có kích
thước rất lớn (1s chiếm 10kb) và có thể nén dễ dàng ( hệ số nén của file Mp3 là 12:1 ).
- Hình ảnh: bao gồm những ảnh trắng, ảnh xám, ảnh màu Các định dạng của
ảnh (bmp, gjf, jpeg, pcx, png, ) Một ảnh có độ phân giải cao có thể chiếm vài
Mb và cũng giống như âm thanh, hình ảnh cũng có thể nén, định dạng của
JPEG có hệ số nén thường lớn hơn 10.
Trang 5- Video kỹ thuật số: là một chuỗi các hình ảnh liên tục nhau Loại dữ liệu
này thường đòi hỏi dung lượng lưu trữ lớn tuy hệ số nén của nó là rất
cao Vận tốc truyền và thu video kỹ thuật số nằm trong khoản 20-30
khung hình một giây Trong các loại video kỹ thuật số, phim hoạt hình là loại nhỏ gọn và dễ lưu trữ hơn các loại khác vì sử dụng các hình ảnh tổng hợp có sử dụng các mẫu chuẩn.
- Tích hợp audio và video.
- Siêu phương tiện: là dạng biểu diễn phi tuyến tính của dữ liệu đa phương
tiện
Trang 6Truy vấn dữ liệu đa phương tiện
Cùng sự vượt bậc của công nghệ thu giữ dữ liệu nghe nhìn và không gian lưu trữ ngày càng gia tăng đã cho phép tạo ra các bộ sưu tập khổng
đồ các dữ liệu đa phương tiện Tuy nhiên, khi CSDL ngày càng nhiều như vậy thật khó khăn cho việc tìm kiếm một hình ảnh hay video nào đó Để giải quyết được vấn đề trên ta có 2 cách truy vấn như sau:
Trang 7Phương pháp 1:
Sử dụng các thông tin nhập thủ công hay bao gồm trong thiết kế của bảng,
như các tiêu đề, các từ khóa mô tả - thường được xác định từ trước trong lược đồ phân loại ( Classification Schemes ) Phương pháp này được biết đến với tên gọi
“ Truy xuất dựa trên thuộc tính “ ( attribute-based retrieval )
Trang 8Phương pháp 2:
Sử dụng các đặc trưng được rút trích từ nội dung của đối tượng đa phương tiện và sự nhận diện đối tượng để phân loại nội dung dữ liệu đa phương tiện Phương pháp này được biết đến với tên gọi: “ Truy xuất dựa trên nội dung “ ( Content-based retrieval )
Trang 9Khái niệm video
Video số hóa:
ORD Video tích hợp lưu trữ, truy xuất và quản lý dữ liệu video số hóa trong 1 CSDL Video có thể được tạo ra bởi một đầu thu video, máy quay phim, video hoạt hình số hóa, các thiết bị quay video chuyên dụng khác, hoặc bởi các thuật toán
chương trình
Một số thiết bị ghi video tiếp nhận một tín hiệu tương tự hay liên tục, chẳng
hạn một video được thu vào một máy quay phim hoặc video được ghi lại từ các
media từ tính và chuyển đổi thành các giá trị số với các đặc trưng điển hình của video chẳng hạn như định dạng, kiểu mã hóa, tỉ lệ khung hình, kích thước khung hình ( chiều rộng và chiều cao ), độ phân giải khung hình, độ dài video, kiểu nén,
số lượng màu sắc và bit rate.
Trang 10Các thành phần của video:
Video số hóa bao gồm các dữ liệu video (các bít đã được số hóa) và các thuộc tính môt tả cho video Dữ liệu video có thể có nhiều định dạng khác nhau, các
kiểu nén, tỉ lệ khung hình, kích thước khung hình, độ phân giải khung hình, thời gian chơi, loại nén, số lượng màu sắc và loại bít phụ thuộc cách dữ liệu video kỹ thuật số đã được ghi lại.
Trang 11- Lưu trữ đa phương tiện: media có thể được luu trữ trong các loại đối tượng
OM hoặc trực tiếp trong BLOBs hoặc BFILEs.
- Truy vấn dữ liệu đa phương tiện:khi được lưu trữ trong CSDL,dữ liệu đa
phương tiện có thể truy vấn và lấy ra bằng cách sử dụng các cột chữ hoặc số khác nhau hoặc các thuộc tính đối tượng bảng để tìm một hàng với dữ liệu mong muốn Ngoài ra, dữ liệu đa phương tiện có thể được truy vấn theo các siêu dữ liệu được trích xuất, theo các cột trong bảng khác và theo nội dung, chẳng hạn như truy xuất nội dung hình ảnh với các chỉ mục chuyên biệt tùy chọn.
Trang 12Tìm kiếm văn bản:
Từ khóa.
Tìm kiếm ảnh.
Tìm kiếm dựa trên nhãn (FlickR, FaceBook).
Tìm kiếm dựa trên thông tin xung quanh (Google) Tìm kiếm dựa trên nội dung.
KẾT LUẬN
Trang 13- Tìm kiếm Audio:
Dựa vào siêu dữ liệu (iTunes)
Dựa vào nội dung (MuscleFish, Foote
- Tìm kiếm video:
Dựa vào từ khóa (Google/UTube)
Dựa vào các dữ liệu kết hợp cùng (ví dụ slides) Tìm theo nội dung (TrecVid)
Trang 14Các bài toán tìm kiếm cơ sở dữ liệu video
Trang 15Phân tích video có cấu trúc
Trang 16Phân tích video không cấu trúc
Trang 17Tìm kiếm video
Tìm kiếm toàn bộ video
• Dựa trên thông tin text và hình ảnh xung quanh đại diện trong mô tả.
Ví dụ: Google/YouTube
• Search for “sunset”
Trang 18BÀI LÀM CÒN NHIỀU THIẾU SÓT RẤT CẦN Ý KIẾN
ĐÓNG GÓP CỦA CÔ VÀ CÁC BẠN