Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
-
NGUYỄN HỮU BẰNG
ĐÁNH GIÁ HIỆU NĂNG CỦA KỸ THUẬT MÃ HÓA
CHUYÊN NGÀNH : KỸ THUẬT VIỄN THÔNG
MÃ SỐ: 60.52.02.08
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
HÀ NỘI - 2017
Trang 2Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS VŨ VĂN SAN
Phản biện 1: ………
Phản biện 2: ……….………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 3LỜI NÓI ĐẦU
Với sự bùng nổ của Internet, đặc biệt là Internet băng thông rộng đã làm thay đổi cả nội dung và kỹ thuật truyền hình Hiện tại, phần lớn các nội dung truyền hình chỉ dừng lại ở mức độ nét cao, nhưng trong tương lai độ nét siêu cao sẽ là một xu thế tất yếu Hệ quả của sự phát triển này là sức ép ngày càng lớn lên hạ tầng truyền dẫn
Để giải quyết vấn đề này, chuẩn mã hóa video thế hệ tiếp theo đã được phát triển với tên gọi mã hóa video hiệu suất cao (HEVC/H.265)
Với mục đích đưa những đánh giá khách quan về hiệu năng của kỹ thuật mã hóa video HEVC/H.265 khi truyền hình qua mạng IP, em xin chọn đề tài nghiên cứu
“Đánh giá hiệu năng của kỹ thuật mã hóa video HEVC/H.265 truyền hình qua mạng
IP.”
Tổng quan, luận văn gồm 3 chương:
Chương 1 trình bày về mã hóa video hiệu suất cao HEVC
Chương 2 giới thiệu về truyền hình qua mạng IP
Chương 3 đánh giá hiệu năng của chuẩn mã hóa HEVC trong kịch bản truyền hình qua mạng IP
Sau hơn một thời gian nỗ lực tìm hiểu cùng với sự chỉ bảo tận tình của các thầy cô trong khoa, đặc biệt là giảng viên TS Vũ Văn San, em đã hoàn thành bài luận văn này Do đây là đề tài còn khá mới và vốn kiến thức bản thân còn hạn chế nên không tránh được các sai sót, kính mong quý thầy cô và các bạn đóng góp ý kiến để bài luận văn này hoàn thiện hơn
Em xin chân thành cảm ơn thầy Vũ Văn San và các thầy cô trong Khoa Quốc tế
và Đào tạo đã tận tình giúp đỡ em trong suốt thời gian qua
Hà Nội, tháng 5 năm 2017
Nguyễn Hữu Bằng
Trang 4CHƯƠNG 1: KỸ THUẬT MÃ HÓA VIDEO HEVC/H.265
1.1 Giới thiệu chung mã hóa video
1.1.1 Tổng quan mã hóa video
Một tín hiệu video số thường chứa một lượng lớn dữ liệu, do đó sẽ gặp rất nhiều khó khăn trong việc lưu trữ và truyền đi trên băng thông kênh truyền hạn chế
Vì vậy để có thể tiết kiệm không gian lưu trữ và băng thông kênh truyền thì ta cần nén (mã hóa) tín hiệu
Để đánh giá chất lượng của bức ảnh (hay khung ảnh video) ở đầu ra của bộ
mã hóa, ta thường sử dụng các tham số sau để đánh giá:
- Sai số bình phương trung bình – MSE (Mean Square Error) định nghĩa cho
cường độ sai khác giữa ảnh gốc và ảnh dự đoán [1]:
2 2
MS
at o
E
Trong đó: + N×N kích thước bù chuyển động
+ hệ số C i, j và R i, j tương ứng với mẫu hiện tại và vùng mẫu tham khảo
+ b số lượng bit/ mẫu
Thông thường, nếu PSNR ≥ 40dB thì hệ thống mắt người gần như không
phân biệt được giữa ảnh gốc và ảnh khôi phục, tức là ảnh nén có chất lượng xuất sắc
• Nếu 30 dB PSNR < 33 dB thì chất lượng ảnh nén bình thường, mắt người
có sự phân biệt được
• Nếu PSNR < 30 dB thì chất lượng ảnh nén kém
Trang 51.1.2 GOP
Một GOP (nhóm các hình ảnh) xác định thứ tự mà khung hình intra và inter được sắp xếp Một chuỗi video thường gồm các GOP liên tiếp Cấu trúc GOP thường được xác định bằng một số cho biết khoảng cách giữa hai ảnh (I hoặc P) Việc lựa chọn kích thước GOP phụ thuộc vào nhiều yếu tố khác như kích cỡ DPB và độ trễ [2]
1.1.3 Lớp mạng trừu tượng (NAL)
Lớp mạng trừu tượng là một tính năng thiết yếu, có sẵn trên cả H.264/AVC và HEVC Về cơ bản, đó là một phương pháp chia luồng bit video thành các đơn vị NAL Nhìn chung, HEVC và H.264/AVC có chung một cấu trúc trừ một số bit tại mào đầu [3]
1.2 Chuẩn mã hóa video H.264/AVC
1.2.1 Bối cảnh ra đời và sự phát triển
H.264 được chấp thuận bởi tổ chức truyền thông quốc tế ITU-T với tên gọi Recommendation H.264 và bởi tổ chức chuẩn hóa quốc tế (ISO/IEC) với tên gọi International Standard 14496-10 (MPEG-4 part 10) Advanced Video Coding
1.2.2 Nguyên lý hoạt động cơ bản
Ngoại trừ tính năng lọc tách khối, H.264 vẫn bao gồm các khối chức năng cơ bản như các chuẩn mã hóa trước đó như dự đoán, biến đổi, lượng tử hóa và mã hóa entropy Sự thay đổi quan trọng trong H.264 đến từ sự cải tiến chi tiết bên trong cách khối chức năng đó
1.2.3 Các đặc điểm nổi bật
So với các chuẩn mã hóa video trước đó, H.264/AVC có một số những đặc điểm nổi bật sau:
• Bù chuyển động với kích cỡ khối thay đổi
• Bủ chuyển động chính xác đến một phần tư mẫu
Trang 6• Tách riêng hình ảnh tham khảo và hình ảnh hiển thị
• Dự đoán trọng số
• Sử dụng bộ lọc tách khối
• Dự đoán trong ảnh sử dụng không gian định hướng
Ngoài ra, H.264/AVC còn có một số đặc tính làm tăng cường khả năng chống sai số và mất dữ liệu như:
• Tham số cấu trúc
• Cấu trúc cú pháp của NAL
• Kích cỡ mảnh linh hoạt
• Dữ liệu dư của ảnh
1.3 Chuẩn mã hóa video HEVC/H.265
1.3.1 Bối cảnh ra đời và sự phát triển
Tiêu chuẩn Mã hóa video hiệu suất cao (High Efficiency Video Coding) phản ánh kinh nghiệm được tích lũy trong khoảng bốn thập kỷ nghiên cứu và ba thập kỉ chuẩn hóa cho công nghệ mã hóa video kỹ thuật số Kết quả, nó đã chính thức được chuẩn hóa trong ITU-T Recommendation H.265 và ISO/IEC International Standard 23008-2 (MPEG-H part 2)
1.3.2 Nguyên lý hoạt động cơ bản
Tiêu chuẩn HEVC được thiết kế cho nhiều mục đích, bao gồm hiệu năng mã hóa, dễ dàng tích hợp hệ thống truyền dẫn và phục hồi dữ liệu bị mất cũng như tính khả thi khi sử dụng kiến trúc xử lý song song
1.3.3 Các đặc điểm nổi bật
Về cơ bản HEVC/H.265 có cấu trúc tương tự như các chuẩn trước đó, tuy nhiên HEVC có nhiều cải tiến mới để đem lại khả năng mã hóa với hiệu suất cao
1.3.3.1 Cấu trúc khối linh hoạt
Thay vì sử dụng khối macroblock như H.264/AVC và các tiêu chuẩn mã hóa trước đó, trong HEVC/H.265, một hình ảnh được chia thành nhiều khối vuông, gọi là
Trang 7khối cây mã hóa (CTB – Coding Tree Blocks) Mỗi thành phần CTB sáng kết hợp với hai thành phần CTB màu và các cú pháp được gộp chung gọi là đơn vị cây mã hóa (CTU – Coding Tree Units) CTU đại diện cho đơn vị xử lý cơ bản trong HEVC
và nó tương tự như khái niệm macroblock trong các tiêu chuẩn mã hóa video trước đây Kích thước CTU lớn hơn thường cho hiệu suất mã hóa tốt hơn nhưng làm tăng thời gian mã hóa và giải mã cũng như yêu cầu bộ nhớ và khả năng tính toán phức tạp hơn
Hình 1.10: Chia CTU thành CU theo cấu trúc cây tứ phân [4]
Các CTB có thể được chia nhỏ hơn nữa theo cấu trúc cây mã hóa thành các khối mã hóa (CB) Đó là đối tượng mà bộ mã hóa quyết định giữa dự đoán trong ảnh hay dự đoán bù chuyển động
Một CTU có thể chia thành các CU với kích cỡ khác nhau Tương tự như CTU, mỗi thành phần CB sáng kết hợp với hai thành phần CB màu cùng với các cú pháp liên quan tạo thành một đơn vị mã hóa (CU) Một CTB chứa một hoặc thành nhiều
CU Và mỗi CU được phân chia thành đơn vị dự đoán (PU) và đơn vị biến đổi (TU)
Trang 8Hình 1.11 : Chia CU thành các PU [4]
Hình 1.12: Chia CTB thành TB và CB theo cấu trúc cây tứ phân [4]
Quyết định mã hóa bằng dự đoán liên ảnh hay trong ảnh được thực hiện ở cấp
CU
1.3.3.2 Phân vùng hình ảnh
Giống như H.264/AVC, trong HEVC/H.265, một hình ảnh được phân chia thành một hoặc nhiều mảnh (slice) Một mảnh chứa một hoặc nhiều CTU hoặc macroblock Sự khác biệt trong HEVC/H.265 là một mảnh có thể giải mã độc lập mà không phụ thuộc vào những mảnh khác trong cùng một ảnh
Trang 91.3.3.3 Xử lý song song
Phần cứng ngày nay cho phép tận dụng khả năng đa luồng ngay cả trên những kiến trúc tiết kiệm điện Nhờ khả năng đa luồng, hiệu năng xử lý được cải thiện đáng
kể Trong HEVC/H.265 giới thiệu hai công cụ hỗ trợ xử lý đa luồng:
• Xử lý song song đầu sóng (WPP)
• Tile
1.3.3.4 Dự đoán trong ảnh
Với tiêu chuẩn HEVC, quá trình dự đoán trong ảnh bao gồm ba bước: xây dựng mảng mẫu tham khảo, dự đoán mẫu và hậu xử lý Ba bước trên đều được thiết
kế tối ưu để đạt hiệu quả mã hóa cao trong khi giảm thiểu các yêu cầu tính toán trong
cả bộ mã hóa và giải mã Các thiết lập chế độ dự đoán bao gồm phương pháp mô hình hóa các loại nội dung thường xuất hiện trong video và hình ảnh tĩnh Phương pháp
dự đoán trong ảnh có thể chia thành hai loại Loại đầu tiên là dự đoán hướng Dự đoán hướng cung cấp khả năng mô hình hóa với độ chính xác cao cho các đối tượng
có cấu trúc định hướng Phương pháp thứ hai, dự đoán phẳng và dự đoán DC hiệu quả với các khu vực hình ảnh mịn Tổng cộng có 35 chế độ được hỗ trợ
1.3.3.5 Dự đoán liên ảnh
Trong khi dự đoán trong ảnh chủ yếu khai thác mối tương quan giữa các mẫu không gian lân cận thì dự đoán liên ảnh lại tận dụng sự tương quan thời gian giữa các hình ảnh để xây dựng dự đoán bù chuyển động (MCP) cho một khối mẫu ảnh Một khối tương ứng trong một hình ảnh được giải mã trước có thể sử dụng làm yếu tố dự báo cho các hình ảnh sau
HEVC sử dụng hai chế độ: dự đoán vector chuyển động nâng cao (AMVP) và chế độ kết hợp Bộ mã hóa quyết định giữa hai chế độ này cho mỗi PU Mỗi chế độ xây dựng một danh sách ứng viên MV Sau đó, nó chọn một trong số đó làm chỉ số
mã hóa và truyền đi trong luồng dữ liệu
Đối với chế độ AMVP, vector chuyển động được dự đoán từ năm không gian lân cận và một ứng viên thời gian
Trang 10Tương tự như H.264, HEVC hỗ trợ vector chuyển động với độ chính xác một phần tư điểm ảnh cho thành phần chói và một phần tám điểm ảnh cho thành phần màu Hoạt động này được thực hiện chủ yếu bằng cách sử dụng bộ lọc nội suy Quá trình nội suy là một thủ tục chuyển hóa các mẫu phân số bằng cách sử dụng các mẫu nguyên
Nội suy mẫu phân số cho các mẫu chói trong HEVC ứng dụng một bộ lọc tap cho vị trí nửa mẫu và 7-tap cho vị trí một phần tư mẫu Số lượng tap là một thông
8-số quan trọng cho các bộ lọc nội suy vì nó ảnh hưởng trực tiếp đến hiệu quả mã hóa
và độ phức tạp khi thực hiện
Dự đoán trọng số là một phương pháp điều chỉnh mẫu cho dữ liệu bù chuyển động Nó rất hữu ích cho việc mã hóa các hiệu ứng mờ dần ứng dụng trong mã hóa mặt người hay chuyển động Trong HEVC, nó được đơn giản hóa bằng cách áp dụng trọng số cho mỗi dự đoán bù chuyển động hoặc trung bình hai dự đoán bù chuyển
động
1.4 Tổng kết chương 1
Phần đầu tiên của chương 1 giới thiệu tổng quan về chuẩn mã hóa video Cùng với đó là cách thức đánh giá chất lượng video khi bị nén có tổn hao Nhóm hình ảnh cũng là một yếu tố quan trọng, cần phải được lưu ý trong quá trình nén video Lớp trừu tượng mạng (NAL) là một tính năng mới trong H.264/AVC và được phát triển trong HEVC cũng được giới thiệu tại phần tổng quan Sau đó, luận văn giới thiệu những nét nổi bật của hai chuẩn nén H.264/AVC và HEVC Trong đó, tập trung chủ yếu vào HEVC với nhiều tính năng cải tiến
Trang 11CHƯƠNG 2: TRUYỀN HÌNH QUA MẠNG IP
2.1 Mô hình hệ thống truyền hình qua mạng IP
2.1.1 Internet video
Hình 2.1 cho thấy một cái nhìn đơn giản về một mạng Internet video Sơ đồ này được chia thành hai phần, khâu sản xuất và phân phối Trong khâu sản xuất, nội dung video được chụp từ một nguồn, được số hóa, chỉnh sửa, gắn nhãn và được nhóm vào một tệp được đặt trên máy chủ nơi nó có thể được truy cập Trong khâu phân phối, một người sử dụng một máy tính kết nối Internet để tìm kiếm nội dung, kết nối với máy chủ, có quyền xem nội dung và sau đó tải tệp tin video hoặc yêu cầu luồng video để xem trên máy tính cá nhân của họ bằng cách sử dụng phần mềm đa phương tiện chuyên biệt
Hình 2.1 Mạng cung cấp Internet Video [9]
2.1.2 IPTV
IPTV chủ yếu được sử dụng để cung cấp các nội dung và dịch vụ mà CATV hoặc hệ thống vệ tinh không thể cung cấp Các nhà cung cấp dịch vụ muốn cung cấp nhiều dịch vụ tiêu dùng qua một mạng đơn lẻ thường chọn công nghệ IP vì nó có thể cung cấp nhiều dịch vụ và tốc độ cao trên một nền tảng duy nhất Trong một hệ thống
Trang 12điển hình, một mạng IP tốc độ cao tư nhân được sử dụng để liên tục cung cấp chương trình video cho hàng trăm hoặc hàng ngàn người xem đồng thời
Trên thực tế, các mạng IPTV là những hệ thống khá phức tạp được cấu thành
từ rất nhiều phần tử, đó là một trong những lý do mà chúng khó thiết kế và phát triển
2.1.3 Tình hình phát triển IPTV tại Việt Nam
Mặc dù, IPTV chỉ mới chiếm hơn 10% thị phần truyền hình trả tiền tại Việt Nam [9] Tuy nhiên, đây dần được xem là xu hướng phát triển tất yếu khi lộ trình số hóa hoàn tất và người xem truyền hình đòi hỏi nhu cầu ngày càng cao về loại hình truyền hình thông minh, kết nối và có tính tương tác cao
Hiện tại, các dịch vụ truyền hình trong nước mới chỉ dừng lại ở mức HDTV Không thể phủ nhận HDTV là một trong những thành tựu to lớn của truyền hình, nhưng với nhu cầu ngày càng cao của người sử dụng, truyền hình độ nét siêu cao sẽ
là xu thế tất yếu trong tương lại
Nếu chỉ sử dụng các kỹ thuật mã hóa hiện nay như MPEG-4, tốc độ luồng dữ liệu cần thiết để truyền một kênh UHDTV sẽ gấp 3-4 lần yêu cầu của một kênh HD
và các hệ thống truyền dẫn sẽ không đáp ứng được
2.2 Mã hóa và giải mã
Video nếu không được nén sẽ có chất lượng cao nhưng không thể chuyển tín hiệu qua mạng truyền thông vì dung lượng quá lớn, trong khi nhu cầu xem và sử dụng video ngày càng cao Đã từ lâu, nén video được xem như một giải pháp quan trọng nhằm giải quyết vấn đề dung lượng và truyền tải video trên mạng
2.3 Ghép kênh
Ở đầu ra bộ mã hóa hình ảnh là các luồng cơ sở (ES) Các luồng cơ sở này cần được ghép kênh với các luồng cơ sở mang tín hiệu âm thanh và các thông tin khác
Luồng cơ sở đóng gói (PES) là phiên bản “dễ xử lý” hơn của các luồng cơ sở
và chứa thông tin thời gian cho phép đồng bộ hóa các luồng âm thanh và hình ảnh
Trang 13Các luồng chương trình kết hợp nhiều loại luồng cơ sở đóng gói (âm thanh, hình ảnh) để hỗ trợ các tác vụ sản xuất (như là ứng dụng ghi lên đĩa DVD, Bluray)
Các luồng truyền tải là một cách khác để kết hợp một luồng cơ sở đóng gói thành một thực thể duy nhất và có thể được vận chuyển qua mạng Các gói luồng truyền tải có độ dài cố định và các luồng sẽ mang theo thông tin đồng hồ cần thiết cho tín hiệu thời gian thực
2.4 Truyền dẫn qua mạng IP
2.4.1 Giao thức giao vận
Giao thức giao vận được sử dụng để kiểm soát việc truyền tải các gói dữ liệu kết hợp với IP Chúng ta sẽ thảo luận về ba giao thức chính thường được sử dụng trong việc truyền video theo thời gian thực:
UDP (User Datagram Protocol): Đây là một trong những giao thức IP đơn giản
và xuất hiện sớm nhất UDP thường được sử dụng cho dữ liệu video và các dữ liệu nhạy cảm về độ trễ khác
TCP (Transmission Control Protocol): Đây là một giao thức Internet được sử dụng rộng rãi để truyền dữ liệu Phần lớn các thiết bị kết nối Internet có khả năng hỗ trợ TCP trên IP (hoặc đơn giản là TCP/IP)
RTP: Giao thức truyền tải thời gian thực: Giao thức này được phát triển cụ thể
để hỗ trợ truyền dữ liệu thời gian thực, chẳng hạn như video
2.4.2 Đóng gói
Đóng gói là quá trình lấy một dòng dữ liệu, định dạng nó thành các gói tin IP,
và thêm các tiêu đề và dữ liệu khác cần thiết để phù hợp với một giao thức cụ thể Quá trình này không phải là một công thức dùng chung cho tất cả Thay vào đó, quá trình đóng gói có thể được thay đổi để đáp ứng yêu cầu hoạt động của các ứng dụng
và mạng khác nhau