- 60 - TÌM KIẾM DỮ LIỆU ĐA PHƯƠNG TIỆN Nguyễn Đại Thắng Giáo viên hướng dẫn: PGS.TS Đỗ Trung Tuấn Daithang1111@yahoo.com Giới thiệu Những tiến bộ gần đây trong công nghệ đa phương t
Trang 1- 60 -
TÌM KIẾM DỮ LIỆU ĐA PHƯƠNG TIỆN
Nguyễn Đại Thắng Giáo viên hướng dẫn: PGS.TS Đỗ Trung Tuấn
Daithang1111@yahoo.com
Giới thiệu
Những tiến bộ gần đây trong công
nghệ đa phương tiện, công nghệ
Internet, công nghệ truyền thông và
sự bùng nổ của World Wide Web đã
đưa đến cuộc cách mạng mới cho
con người Con người đã thực sự
bước vào kỉ nguyên đa phương tiện,
cùng với những tiện ích là hàng trăm
vấn đề nảy sinh Trong đó vấn đề
nổi cộm là việc tìm kiếm ảnh, âm
thanh và video … để có thể tận dụng
được mọi tài nguyên sẵn có trong
các tuyển tập và trên Internet Sự đa
dạng của các loại dữ liệu cũng như
kích thước ngày càng lớn của chúng
yêu cầu phải có những công cụ và
phương pháp khác nhau Khoá luận
này tập trung vào các nguyên lý cơ
bản cũng như các công nghệ có thể
phát triển để tìm kiếm dữ liệu đa
phương tiện Khoá luận cũng Demo
một hệ thống lưu trữ và tìm kiếm
Video sử dụng các thuộc tính gán
Chương 1 Các vấn đề cơ bản trong tìm kiếm
dữ liệu đa phương tiện
Chương này đưa ra toàn bộ các vấn đề liên quan
đến tìm kiếm dữ liệu đa phương tiện Với việc
trình bày các kiến thức từ cơ bản nhất cho đến
các vấn đề kĩ thuật, chương này có thể giúp ta
hiểu được mọi khía cạnh liên quan đến vấn đến
tìm kiếm dữ liệu đa phương tiện Nội dung
chính như sau:
1.1 Giới thiệu
Giới thiệu về dữ liệu đa phương tiện và nhu cầu
tìm kiếm
1.2 Tìm kiếm thông tin
Vấn đề tìm kiếm thông tin trong các hệ thống dữ
liệu đòi hỏi phải tuân theo một số tiêu chuẩn
Trong đó việc sử dụng các ngôn ngữ đánh chỉ số (indexing language) là vấn đề cơ bản nhất cần quan tâm Việc sử dụng ngôn ngữ này giúp cho các truy vấn người dùng và các mô tả đối tượng trong cơ sở dữ liệu được thống nhất, từ đó giúp việc tìm kiếm được thuận lợi
1.3 Chuẩn bị các đối tượng thông tin
Các đối tượng thông tin trong thực tế là một mớ hỗn độn, chúng ta phải tổ chức chúng vào cơ sở
dữ liệu sao cho việc khai thác và sử dụng là thuận lợi nhất Điều này đối với văn bản là điều
dễ dàng, tuy nhiên với loại dữ liệu âm thanh, hình ảnh thì rất phức tạp
1.4 Tìm kiếm đa phương tiện
Với các loại dữ liệu đa phương tiện khác nhau thì phải có các cách thức tìm kiếm khác nhau Tuy tất các chúng đều có thể đưa về tìm kiếm văn bản tuy nhiên có một số đặc điểm ngăn cản điều này Ví dụ như đặc tính thời gian của các Video, việc khó khăn khi nhận dạng các âm thanh, tính chủ quan của người dùng v.v Phần này giải quyết các cách thức tìm kiếm cho các dạng khác nhau của dữ liệu như văn bản, ảnh, video…
1.5 Đối sánh
Việc tìm kiếm luôn luôn liên quan đến đối sánh các mô tả đối tượng và truy vấn Những phương pháp đối sánh nào được sử dụng và hợp lý cho loại dữ liệu nào được giải quyết trong phần này
1.6 Đo đạc chất lượng
Trong khi xây dựng các hệ thống tìm kiếm đa phương tiện ta luôn phải quan tâm đến chất lượng cũng như hiệu suất của hệ thống Các thông số chính trong việc đo đạc hệ thống như
độ chính xác, độ tìm kiếm được phân tích
Chương 2 Một số hệ thống tìm kiếm
Chương này đưa ra các trang tìm kiếm áp dụng các phương pháp đã đưa ra trong chương 1 để
Trang 2- 61 -
minh họa cho tính ứng dụng của chúng Các mặt
mạnh, yếu của các trang tìm kiếm đối với các
loại phương tiện (ảnh, âm thanh, Video…) được
phân tích
Chương 3 Lưu trữ dữ liệu Video
Hệ thống lưu trữ Video có các đặc điểm rất khác
so với các hệ thống lưu trữ khác Sự khác nhau
này xuất phát từ đặc tính không gian và thời
gian của Video Do đó, việc xây dựng hệ thống
cần tính đến một số vấn đề:
3.1 Xây dựng mô hình dữ liệu Video
Có nhiều phương pháp mô hình hoá dữ liệu
Video để phù hợp với việc lưu trữ, phân tích và
tìm kiếm Phần này đưa ra một số mô hình
chính và trực quan của Video cũng như các
điểm mạnh, điểm yếu của chúng
3.2 Việc phân tích cảnh Video
Phân tích cảnh Video rất quan trọng trong việc
xác định ngữ ngữ của Video Một số thuật toán
phát hiện sự thay đổi cảnh được đưa ra đối với
các cảnh thay đổi đột ngột, thay đổi từ từ và đối
với sự thay đổi cảnh trong Video nén
3.3 Đánh chỉ số Video
Để tiện cho việc tìm kiếm, Video cần được đánh
chỉ số phù hợp Ngoài các phương pháp giống
với văn bản, một số phương pháp khác đặc
trưng cho đánh chỉ số Video cũng được đưa ra
Chương 4 Hệ thống lưu trữ Video
Đối với một trường đại học hoặc một tổ chức
lớn thì các dữ liệu Video là rất phổ biến Việc
lưu trữ và tìm kiếm loại dữ liệu này thường
không cần thiết phải sử dụng các công cụ mạnh
mà thường dùng các thuộc tính gán (giống như
văn bản) để hỗ trợ việc khai thác Video Tôi xây
dựng một hệ thống Video đơn giản sử dụng các
thuộc tính do người dùng gán để hỗ trợ việc tìm
kiếm Tuy nhiên để hỗ trợ cho một khối lượng
lớn dữ liệu thì hệ thống cần phải bổ xung các
công cụ của xử lý ngôn ngữ Một hệ thống tham
khảo (The Digital Library Project) đang được
xây dựng tại trường đại học University of
California, Berkeley, USA
Tài liệu tham khảo
[1] Gupta, T Weymouth, and R Jain M, The VIMSYS model, 1991
[2] T G.A Smith and G Davenport, The stratification system : A design environment for random access memory, 1992
[3] E Oomoto and K Tanaka, Design and implementation of Video- object database system, 1993
[4] B Shahraray, Scene change detection and content-based sampling of Video sequences, SPIE, 1995
[5] K Otsuji, Y Tonomura, and Y Ohba, Video browsing using bright-ness data, 1991 [6] Swanberg, C F Shu, R Jain Knowledge guided parsing in Video databases, 1993 [7] S W Smoliar and H J Zhang, Contenr- Based Video indexing and Retrieval, 1994 [8] Elsevier, A Rule- Base Video Database System Architecture, 2002
[9] Jelena Tesic, Intelligent Image Database Seaching System, UCSB, 2002
[10] ChrisTos Faloutsos, Multimedia Indexing, Carnegie Mellon University, Pittsburgh, Pennsylvania, 2002
[11] Ying Li and C-c Jay Kuo, Introduction to Content-Based Image Retrieval-Overview
of Key Techniques, University of Southern, Los Angeles, California, 2002
[12] Wallapak Tavanapong and Kien A.Hua, Design and Implementation of a Video Browsing System for The Internet, Department of Computer Science, Iowa State University, Ames, USA, 2001
[13] Marti A.Hearst, Next Generation Web Search: Setting Our Sites, University of California, Berkeley, 2000
[14] Arjen P.de Vries, Content Dependence in Multimedia Database, Journal of The American Society for Information Science and Technology, 2001
[15] Dr Andrew Salway, Modelling Multimedia Information, Lectures of Surrey UK, 2005