Trình bày các khái niệm cơ bản về video và video CODEC COde/DECode hệ nén và giải nén video; cung cấp các thông tin chi tiết các thành phần trong video CODEC gồm: mô hình không gian, mô
Trang 1Nghiên cứu hệ nén H.264/AVC và đánh giá hiệu năng của H.264/AVC đối với video tăng
cường độ sâu
Trần Thị Thịnh
Trường Đại học Công nghệ Đại học Quốc gia Hà Nội Luận văn ThS Công nghệ thông tin: 60 48 10 Người hướng dẫn : TS Lê Thanh Hà
Năm bảo vệ: 2013
75 tr
Abstract Trình bày các khái niệm cơ bản về video và video CODEC (COde/DECode)
(hệ nén và giải nén video); cung cấp các thông tin chi tiết các thành phần trong video CODEC gồm: mô hình không gian, mô hình thời gian và mã hóa entropy Trình bày về
hệ nén H.264/AVC, bao gồm quy trình nén và giải nén của H.264/AVC và các hồ sơ nén Các kỹ thuật được sử dụng cho các bước trong quy trình nén sẽ được trình bày chi tiết: dự đoán hình ảnh tham chiếu, chuyển đổi, lượng tử, mã hóa entropy Trình bày việc áp dụng chuẩn nén H.264/AVC cho các video tăng cường độ sâu do tác giả thực hiện
Keywords.Hệ nén; Video; Quy trình nén; Phần mềm; Công nghệ thông tin
Content
Trong những năm gần đây, truyền thông đa phương tiện phát triển mạnh mẽ, các kỹ thuật mới ra đời nhằm mục đích đáp ứng nhu cầu giải trí cho con người ngày một tốt hơn Các ứng dụng đa phương tiện thời gian thực trên mạng di động, mạng Internet, mạng truyền hình ngày càng phát triển Các thiết bị phần cứng phát triển vượt bậc cho phép người sử dụng dễ dàng thu phát video không chỉ các video thông thường
mà còn các video 3D Các video thu thập có chất lượng cao và dung lượng lớn Các ứng dụng video 3D ngày càng phát triển như gọi điện thoại, chơi game 3D, truyền hình 3D… Đồng nghĩa với việc này là các vấn đề về khả năng lưu trữ và truyền dữ liệu Với các video lớn vấn đề truyền thông hiện nay đang gặp một số khó khăn: băng thông đường truyền, nhiễu kênh… Thay vì việc cải thiện băng thông đường truyền cần đầu tư lớn và khó khăn, thì phương pháp giảm kích thước dữ liệu bằng các kỹ thuật nén là một cách giải quyết hiệu quả các khó khăn trên
Trang 2Hiện tại có nhiều phương pháp biểu diễn dữ liệu video 3D, một trong số đó là bổ sung thêm thông tin về độ sâu vào các chuỗi video màu thông thường Mặc dù đây không phải là một giải pháp toàn diện dữ liệu video ba chiều, nhưng nó cho phép các hệ thống hiển thị tổng hợp khung hình 3D dựa trên ảnh độ sâu [1] (Depth Image Based Rendering – DIBR) Việc bổ sung thêm thông tin độ sâu vào video màu truyền thống làm gia tăng kích thước dữ liệu cần lưu trữ và truyền tải video, do đó việc khảo sát ảnh hưởng của dữ liệu độ sâu khi nén cùng với video màu là điều cần thiết
Hiện nay đã có rất nhiều kỹ thuật nén dữ liệu đa phương tiện như: chuẩn JPEG, chuẩn JPEG2000, chuẩn MPEG tuy nhiên hiệu quả nén của các tiêu chuẩn này cũng chưa được cao và dung lượng còn rất lớn, thành công của chuẩn nén MPEG-4 Part 2 trong ứng dụng truyền hình số, các ứng dụng đồ họa nhưng với yêu cầu bộ mã hóa có thể tương thích với các ứng dụng tốc độ bit thấp thì nó không đáp ứng hiệu quả Từ việc nghiên cứu khắc phục nhược điểm của MPEG-2, phát triển bổ sung cho MPEG-4 Part 2 để cho ra đời những chuẩn nén tiên tiến hơn, đặc biệt là H.264/AVC (MPEG-4 part 10) H.264/AVC là sự kết hợp giữa 2 tổ chức nổi tiếng: nhóm chuyên gia mã hóa video của tổ chức ITU và nhóm chuyên gia xử lý ảnh động ISO/IEC Sử dụng chuẩn nén H.264 giúp giảm băng thông mạng và dung lượng sử dụng ổ cứng khi ghi hình, thực tế là giảm hơn 50% so với chuẩn trước đó và giảm được 80% băng thông và kích thước dữ liệu lưu trữ nhưng chất lượng video vẫn giữ được chất lượng hình ảnh Chính
vì những ưu điểm đó mà MPEG-4 H.264/AVC đã trở thành chuẩn nén được sử dụng phổ biến
Tuy nhiên, đánh giá trên dành cho việc nén video thông thường, chưa có nhiều nghiên cứu và thực nghiệm cho việc dùng H.264/AVC để nén video tăng cường độ sâu Vì vậy, tôi đã chọn đề tài “Nghiên cứu hệ nén H.264/AVC và đánh giá hiệu năng của H.264/AVC đối với video tăng cường độ sâu” nhằm tìm hiểu nguyên lý hoạt động
cơ bản của một hệ nén video hiện đại và việc áp dụng hệ nén này đối với dạng video tăng cường độ sâu Luận văn gồm 4 chương:
Chương 1 trình bày các khái niệm cơ bản về video và video CODEC
(COde/DECode) (hệ nén và giải nén video) Phần này cung cấp các thông tin chi tiết các thành phần trong video CODEC gồm: mô hình không gian, mô hình thời gian và
mã hóa entropy
Chương 2 trình bày về hệ nén H.264/AVC Nội dung phần này bao gồm quy
trình nén và giải nén của H.264/AVC và các hồ sơ nén Các kỹ thuật được sử dụng cho
Trang 3các bước trong quy trình nén sẽ được trình bày chi tiết: dự đoán hình ảnh tham chiếu, chuyển đổi, lượng tử, mã hóa entropy
Chương 3 trình bày việc áp dụng chuẩn nén H.264/AVC cho các video tăng
cường độ sâu do tác giả thực hiện
Và cuối cùng Chương 4 đưa ra các kết luận và hướng phát triển của luận văn
TÀI LIỆU THAM KHẢO
Tài liệu tiếng Anh
[1] Dong Tian, Po-Lin Lai, Patrick Lopez, Cristina Gomila, "View Synthesis Techniques for 3D Video", Proc of SPIE Vol 7443 74430T-1
[2] Clifford De Raffaele, Kenneth P Camilleri ; “ Performance Improvement of Segmentation-Based Depth Representation in 3D Imagery by Region Merging ”
[3] G Bjøntegaard, Calculation of Average PSNR Differences, between RD-Curves, ITU-T SG16 Q.6 Document, VCEG-M33, Austin, Apr 2001
[4] G Sullivan and T Wiegand, “ Rate-distortion optimization for video compression,” IEEE Signal Processing Magazine, vol 15, no 6, pp 74- 90, Nov.1998 [5] http://social.msdn.microsoft.com/Forums/en-US/home
[6] Iain E G Richardson, The Robert Gordon University, Aberdeen, UK; “H.264 and MPEG-4 Video Compression”
[7] ISO/IEC 14496-10 and ITU-T Rec H.264, Advanced Video Coding, 2003
[8] ITU-T (formerly CCITT), “Codecs for videoconferencing using primary digital group transmission ” ITU-T Recommendation H.120; version 1, 1984; version 2, 1988 [9] ITU-T (formerly CCITT), “Video codec for audiovisual services at p x 64 kbit/s” ITU-T Recommendation H.261; version 1, nov.1990; version 2, mar 1993
[10] ITU-T (formerly CCITT) and ISO/IEC JTCI , “Generic coding of moving pictures and associated audio information” ITU-T Recommendation H.262, Nov 1994
Trang 4[11] Joint Video Team (JVT), KTA Reference Software, http://iphome.hhi.de/suehring/tml/
[12] K R Rao and P Yip, Discrete Cosine Transform, Academic Press, 1990
[13] Philipp Merkle, Aljoscha Smolic, Karsten Müller, and Thomas Wiegand;
“MULTI-VIEW VIDEO PLUS DEPTH REPRESENTATION AND CODING” Image Communication Group, Image Processing Department, Fraunhofer Institute for Telecommunications - Heinrich-Hertz-Institut, Einsteinufer 37, 10587 Berlin, Germany
[14] Rafael C Gonzalez and Richard E Woods Digital Image Processing
Addison-Wesley, New York, 1992
[15] Recommendation ITU-R BT.601-5, Studio encoding parameters of digital television for standard 4:3 and wide-screen 16:9 aspect ratios, ITU-T, 1995
[16] Wiegand, T.; Sullivan, G J.; Bjntegaard, G.; Luthra, A, “ Overview of the H.264/AVC video coding standard”, IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL 13, NO 7, July 2003