Phương pháp giảm thời gian dự đoán nội khung trong chuẩn mã hóa video H.266/Versatile Video Coding

Bài viết đề xuất một phương pháp làm giảm độ phức tạp tính toán cho quá trình dự đoán nội khung của mô hình mã hóa video VVC bằng cách giảm số lượng ứng viên trong tập các chế độ dự đoán. Kết quả cho thấy, phương pháp đề xuất giúp làm giảm trung bình từ 26.67% đến 28.47% thời gian xử lý.

Trang 1

Phương Pháp Giảm Thời Gian Dự Đoán Nội

Khung Trong Chuẩn Mã Hóa Video

H.266/Versatile Video Coding

Nguyễn Quang Sang1, Bùi Thanh Hương1,2, Đinh Triều Dương1, Hoàng Văn Xiêm1

1Khoa Điện tử Viễn thông, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội

2Khoa Công nghệ thông tin, Trường Đại học Xây dựng

Email: xiemhoang@vnu.edu.vn

Abstract— Vào năm 2020, tiêu chuẩn mã hóa video

H.266/Versatile Video Coding (VVC) đã được ISO và

ITU-T thông qua Để đạt được hiệu năng mã hóa cao

nhất, mô hình mã hóa video này đã được nghiên cứu và

tích hợp nhiều kỹ thuật mã hóa mới Trong đó, đối với

phương pháp dự đoán nội khung, số lượng chế độ dự

đoán được tăng lên 67 chế độ Mặc dù biến đổi

Hadamard được sử dụng giúp làm giảm độ phức tạp tính

toán nhưng so với tiêu chuẩn mã hóa video H.265/High

Efficiency Video Coding (HEVC), thời gian xử lý của

VVC vẫn còn rất cao Trong bài báo cáo này, chúng tôi

đề xuất một phương pháp làm giảm độ phức tạp tính

toán cho quá trình dự đoán nội khung của mô hình mã

hóa video VVC bằng cách giảm số lượng ứng viên trong

tập các chế độ dự đoán Kết quả cho thấy, phương pháp

đề xuất giúp làm giảm trung bình từ 26.67% đến 28.47%

thời gian xử lý

Keywords- H.266/Versatile Video Coding, dự đoán nội

khung, lựa chọn hướng dự đoán

I GIỚITHIỆU Với sự phát triển của công nghệ sản xuất thiết bị

ghi hình và màn hình hiển thị trong những năm trở lại

đây, các ứng dụng video liên tục được nâng cao chất

lượng để tăng tính trải nghiệm cho người dùng Ngày

nay, chúng ta có thể xem được những video với tốc độ

khung hình cao hiển thị chuyển động được mượt mà

hơn, video độ phân giải lớn (HD, Full-HD, 2K, 4K…)

cho hình ảnh sắc nét hơn, video 360o để ghi lại hình

ảnh góc rộng… Tuy nhiên, với những loại hình video

này chất lượng cao này, thách thức đặt ra cho các hệ

thống truyền thông đa phương tiện là lượng dữ liệu vô

cùng lớn trong khi băng thông và khả năng lưu trữ của

thiết bị còn nhiều hạn chế

Để giải quyết các vấn đề cấp thiết trên, từ năm

2015, các tổ chức uy tín trên thế giới đã bắt đầu nghiên

cứu mô hình mã hóa video thế hệ mới mang tên

H.266/Versatile Video Coding (VVC) [1] Mô hình mã

hóa video thế hệ mới này đã được chính thức thông qua

như một tiêu chuẩn mã hóa video vào tháng 7 năm

2020 Các kết quả thử nghiệm chỉ ra rằng, so với tiêu

chuẩn mã hóa video H.265/High Efficiency Video

Coding (HEVC) [2], ở cùng một mức chất lượng, tiêu chuẩn mã hóa video H.266/VVC có thể tiết kiệm tới hơn 40% lượng bit tiêu thụ [3]

Để đạt được hiệu năng mã hóa cao, nhiều kỹ thuật mới đã được nghiên cứu và tích hợp vào bộ mã hóa

H.266/VVC Hình 1 dưới đây mô tả sự khác biệt về các

kỹ thuật được sử dụng trong HEVC và VVC Bên cạnh việc áp dụng cấu trúc phân chia khối hình đa dạng (cây phân chia nhị phân, tam phân, tứ phân - QTMT) ở tất

cả các cấu hình mã hóa, riêng với mã hóa dự đoán nội khung, có thể kể đến số lượng chế độ dự đoán tăng lên

67 (so với 35 chế độ ở HEVC), và một số kỹ thuật mở rộng được áp dụng như kỹ thuật đa đường tham chiếu (multiple-reference line – MRL), kỹ thuật chia nhỏ khối nội khung (intra sub-partition – ISP), kỹ thuật sao chép khối nội khung (intra block copy – IBC) Tuy nhiên, các kỹ thuật này khiến cho bộ mã hóa có độ phức tạp tính toán cao, gây ra độ trễ lớn trong quá trình truyền – nhận dữ liệu Cũng theo số liệu tại báo cáo [3], thời gian xử lý của VVC cao hơn HEVC tới hơn 30 lần

HEVC intra

VVC intra

QT

35 chế độ

dự đoán

QTMT

67 chế độ

dự đoán

MRL ISP IBC

Hình 1 Các kỹ thuật được áp dụng cho chế độ dự đoán nội

khung trong HEVC và VVC

Trong các kỹ thuật nêu trên, có thể thấy việc tăng

số lượng chế độ dự đoán từ 35 lên 67 ảnh hưởng trực tiếp đến việc cải thiện hiệu năng nhưng cũng là nguyên nhân khiến độ phức tạp mã hóa tăng lên đáng kể Việc giảm thời gian xử lý cho dự đoán nội khung luôn là bài toán gây ra nhiều thách thức cho các nhà nghiên cứu

Trang 2

khi vừa phải giảm thiểu được độ phức tạp tính toán,

vừa phải đảm bảo được hiệu năng mã hóa không bị ảnh

hưởng Thông qua việc phân tích đặc trưng về kích

thước và mối quan hệ giữa các khối hình lân cận, bài

báo cáo này đề xuất một phương pháp giảm thời gian

mã hóa cho chế độ dự đoán nội khung trong mô hình

mã hóa video H.266/VVC bằng cách giảm số lượng

hướng dự đoán của khối hình

Bài báo cáo được trình bày theo cấu trúc gồm 4

phần Phần 1 giới thiệu tổng quan về mục đích và động

lực nghiên cứu Phần 2 trình bày chi tiết về chế độ dự

đoán nội khung trong mô hình mã hóa video

H.266/VVC và các nghiên cứu giảm thời gian mã hóa

liên quan Trong phần 3 của bài báo cáo, chúng tôi mô

tả về thuật toán được đề xuất Các kết quả kiểm thử và

kết luận được trình bày lần lượt trong phần 4 và 5

II DỰĐOÁNNỘIKHUNGTRONGH.266/VVC

VÀCÁCNGHIÊNCỨULIÊNQUAN

A Dự đoán nội khung trong mô hình mã hóa video

H.266/VVC

Tiêu chuẩn mã hóa video H.266/VVC được nghiên

cứu và chuẩn hóa nhằm hướng tới việc có thể mã hóa

các video độ phân giải cao (Full-HD, 2K, 4K, …), nên

kích thước khối hình tối đa cho phép lên tới 128×128

Do đó, số lượng chế độ dự đoán trong dự đoán nội

khung của VVC lên tới 67 chế độ, bao gồm chế độ

Planar, chế độ DC và 65 hướng trong chế độ dự đoán

theo hướng (Angular Mode) [4] Hình 2 mô tả các chế

độ và hướng dự đoán nội khung trong VVC Các

hướng được ký hiệu bởi mũi tên màu đen là các hướng

giống với hướng trong HEVC Các hướng được ký

hiệu bởi mũi tên màu đỏ là các hướng mới được bổ

sung trong VVC

0: Planar 1: DC

Hình 2: Các chế độ dự đoán nội khung trong VVC

Đối với các khối có dạng hình chữ nhật (N×N,

2N×2N, N×2N, N×3N…), VVC cho phép thay đổi vị

trí giữa các hướng để kết quả dự đoán được tối ưu nhất

Tùy vào tỉ lệ Chiều Rộng / Chiều Cao của khối hình mà

các hướng dự đoán được thay thế khác nhau (Bảng I)

Chế độ này gọi là dự đoán góc rộng (Wide-angle intra

prediction) Hình 3 là một ví dụ sử dụng chế độ dự

đoán góc rộng cho khối hình có tỉ lệ Chiều Rộng / Chiều cao bằng 1/2 và 2

Bảng I: Các hướng bị thay thế trong chế độ dự đoán góc

rộng

Tỉ lệ Chiều Rộng /Chiều Cao (W/H) Các hướng bị thay thế

W / H = 16 Hướng 12, 13,14,15

W / H = 4 Hướng 2,3,4,5,6,7,8,9,10,11

W / H = 2 Hướng 2,3,4,5,6,7,

W / H = 1

W / H = 1/2 Hướng 61,62,63,64,65,66

W / H = 1/4 Hướng 57,58,59,60,61,62,63,64,65,66

W / H = 1/8 Hướng 55, 56

W / H = 1/16 Hướng 53, 54, 55, 56

Hình 3: Ví dụ về dự đoán góc rộng trong VVC

Để giảm thời gian xử lý cho bộ mã hóa, biến đổi Hadamard [5] đã được sử dụng như một phép biến đổi thay thế và ước lượng chi phí RD (RDCost) Các chế

độ dự đoán có giá trị tổng sai khác sau biến đổi (SATD) nhỏ nhất sẽ được bộ mã hóa chọn để tính toán chi phí RD và đưa ra quyết định lựa chọn chế độ dự đoán cho khối hình hiện tại Cụ thể, quy trình lựa chọn chế độ mã hóa trong VVC được tiến hành theo các bước sau:

Bước 1: Tính toán tổng giá trị tuyệt đối sai khác sau

biến đổi (SATD) cho chế độ Planar, DC và các hướng

giống với HEVC (có mũi tên màu đen trong Hình 2),

sử dụng biến đổi Hadamard như công thức (1)

g pred i

SATD= j TH y −y TH (1)

Trong đó: TH là ma trận biến đổi Hadamard, y org là

giá trị pixel gốc, y pred là giá trị pixel dự đoán, TH T là ma

trận chuyển vị của TH

Bước 2: Lựa chọn N hướng có SATD nhỏ nhất (N

phụ thuộc vào kích thước khối hình) và các hướng bên cạnh nó (là các hướng mới trong VVC, có mũi tên màu

đỏ trong Hình 2) để thêm vào tập các ứng viên

Bước 3: Thêm các hướng có xác suất cao nhất cho

dự đoán (Most Probable Mode – MPM) để thêm vào tập các ứng viên Các hướng này là các hướng có tần

Trang 3

suất xuất hiện nhiều nhất khi dự đoán các khối hình lân

cận

Bước 4: Tính RDcost cho tập các ứng viên dựa vào

công thức (2) và (3)

org pred i

Trong đó SSD là tổng bình phương sai khác (Sum

Square Different), y org là giá trị pixel gốc, y pred là giá trị

pixel dự đoán, λ là hằng số Lagrange, R là lượng bit

cần để mã hóa

Chế độ dự đoán được bộ mã hóa lựa chọn là chế độ

có giá trị RDCost nhỏ nhất

B Các nghiên cứu giảm thời gian mã hóa cho dự

đoán nội khung trong H.266/VVC

Kể từ khi bắt đầu được triển khai xây dựng bộ mã

hóa vào năm 2015, các nghiên cứu giảm thời gian mã

hóa cho dự đoán nội khung liên tục được công bố

Tác giả Naima Zouidi và cộng sự đề xuất phương

pháp giảm số lượng chế độ dự đoán tại công bố [6]

Dựa vào hệ số lượng tử và độ sâu phân chia nhị phân

của khối hình, bộ mã hóa sẽ đưa ra một danh sách N

chế độ dự đoán nhất định (N<35), qua đó giảm thời

gian tính toán trong quá trình biến đổi Hadamard

Tác giả Yamei Chen [7] và công sự đề xuất phương

pháp kết thúc sớm quá trình lựa chọn chế độ dự đoán

bằng cách sắp xếp lại tập các chế độ dự đoán được lựa

chọn sau khi biến đổi Hadamard Trong quá trình tính

toán RDCost, nếu giá trị RDCost của chế độ hiện tại

lớn hơn một giá trị ngưỡng cho trước thì quá trình lựa

chọn chế độ dự đoán dừng lại

III ĐỀXUẤTPHƯƠNGPHÁPGIẢMTHỜI

GIANDỰĐOÁNNỘIKHUNGTRONGVVC

Như đã trình bày ở phần I, việc tăng số lượng chế độ

dự đoán từ 35 lên 67 là nguyên nhân chính làm tăng

thời gian xử lý trong quá trình dự đoán nội khung của

bộ mã hóa

Để giải quyết bài toán giảm thời gian mã hóa cho

chuẩn mã hóa video H.266/VVC, chúng tôi đề xuất

thuật toán lựa chọn tập các ứng viên cho dự đoán nội

khung dựa trên đặc tính về kích thước khối hình và

thông tin từ các khối hình lân cận

Trước hết, chúng tôi thống kê ở phía giải mã tần suất

được chọn của các chế độ dự đoán được lựa chọn và

nhận thấy chế độ Planar và chế độ DC có tần suất xuất

hiện lớn nhất Kết quả khảo sát 4 chuỗi video được

thống kê tại Bảng II Có thể nhận thấy, tần suất chế độ

Planar được chọn dao động từ 12.19% đến 35.26% tần

suất chế độ DC được chọn dao động từ 14.67% đến

26.49% Đối với chế độ dự đoán theo hướng (hướng số

2 đến hướng số 67), tần suất được lựa chọn dao động từ

44.64% đến 61.46% (trung bình tần suất mỗi hướng từ

0.09% đến 0.12%)

VVC sử dụng cấu trúc cây phân chia tứ phân kết hợp nhị phân và tam phân nên cho phép khối hình mã hóa có kích thước dao động từ 4×4 đến 128×128 Đối với các khối hình có kích thước từ 8×8 trở xuống, giá trị các điểm ảnh trong khối hình không có nhiều sự thay đổi

Bảng II: Tần suất được chọn của các chế độ dự đoán nội

khung

Chuỗi video QP Planar DC Angular Angular TB BasketballPass 22 37 30.32 30.53 17.96 24.83 51.73 44.64 0.10 0.09

RaceHorses 22 37 35.26 29.96 18.87 24.41 45.87 45.63 0.09 0.09

Từ các phân tích và nhận định trên, chúng tôi đề xuất thuật toán giảm thời gian dự đoán nội khung trong H.266/VVC gồm các bước sau:

Bước 1: Kiểm tra kích thước khối hình cần mã hóa

Nếu kích thước khối hình nhỏ hơn hoặc bằng 8×8, thay đổi tập các chế độ dự đoán và tiến hành tính toán RDCost theo các bước đã nêu trong phần II.A Tập các

chế độ dự đoán gồm: {Planar, DC, 2, 18, 34, 50, 66}

Trong đó, chế độ Planar và DC là 2 chế độ có xác suất được lựa chọn nhiều nhất; hướng số 18 và 50 là các hướng theo chiều dọc và chiều ngang; hướng số 2, 34,

66 là hướng dự đoán tới các góc của khối hình (Hình 3) Nếu kích thước khối hình lớn hơn 8×8, chuyển sang

bước 2

Bước 2: Thu thập thông tin về chế độ dự đoán nội

khung của các khối hình lân cận ở các vị trí phía trên, bên trái, góc trên bên trái, góc trên bên phải để thêm vào tập các ứng viên Tiếp tục bổ sung các chế độ Planar, chế độ DC và các chế độ liền kề vào các ứng viên Ví dụ, các chế độ của các khối hình lân cận là {a,

b, c, d} thì tập các ứng viên là {Planar, DC, a-1, a, a+1, b-1, b, b+1, c-1, c, c+1, d-1, d, d+1}

Bước 3: Tính toán giá trị SATD sau khi biến đổi

Hadamard với các chế độ thu được ở bước 2

Bước 4: Chọn ra 2 chế độ có giá trị SATD nhỏ nhất

và các chế độ trong tập MPM để tính toán giá trị RDCost

Bước 5: Lựa chọn chế độ có giá trị RDCost nhỏ

nhất và kết thúc quá trình dự đoán

2 18

0: Planar 1: DC

Hình 3: Các chế độ dự đoán cho khối hình nhỏ hơn hoặc

bằng 8×8

Trang 4

Kết Thúc

Kích thước Khối hình <= 8×8

Tập các chế độ dự

đoán gồm: {Planar,

DC, 2, 18, 34, 50,

66}

Tìm kiếm chế độ

dự đoán tốt nhất

theo các bước

trong phần II.A

Thu thập chế độ dự đoán của các khối hình lân cận

Thêm các chế độ Planar, DC và các chế

độ liền kề vào tập ứng viên

Biến đổi Hadamard

Chọn 2 chế độ có SATD nhỏ nhất và các chế độ MPM

Tính toán giá trị RDCost

Đưa ra chế độ dự đoán tốt nhất

Bắt Đầu

Đúng

Sai

Hình 4: Thuật toán giảm thời gian dự đoán nội khung trong

H.266/VVC

IV MÔPHỎNGVÀĐÁNHGIÁKẾTQUẢ

A Điều kiện kiểm thử

Phương pháp đề xuất được thực thi trên phần mềm

tham chiếu VVC Test Model 14 (VTM 14) [8], sử

dụng cấu hình mã hóa All-Intra (AI) ở 4 mức hệ số

lượng tử (QP) 22, 27, 32, 37

Các chuỗi video kiểm thử, môi trường kiểm thử

được thống kê cụ thể ở Bảng III và Bảng IV

Mức độ giảm thiểu về thời gian xử lý của bộ mã hóa

được tính theo công thức (4):

100%

P O O

T

−

Trong đó, T O là thời gian xử lý của bộ mã hóa gốc,

T P là thời gian xử lý của bộ mã hóa sử dụng phương pháp đề xuất

Bảng III: Các chuỗi video kiểm thử

Chuỗi video Độ phân giải khung hình Tốc độ

Số khung hình mã hóa

BasketballPass 416×240 50 Hz 500 BQSquare 416×240 60 Hz 600 BlowingBubbles 416×240 50 Hz 500 RaceHorsesD 416×240 30 Hz 300 BasketballDrill 832×480 50 Hz 100 BQMall 832×480 60 Hz 100 PartyScene 832×480 50 Hz 100 RaceHorsesC 832×480 30 Hz 100 FourPeople 1280×720 60 Hz 100 Johnny 1280×720 60 Hz 100 Kimono 1920×1080 24 Hz 100 ParkScene 1920×1080 24 Hz 100

Bảng IV: Cấu hình phần cứng

Bộ vi xử lý Intel® Core™ i7-4800MQ

@2.7 GHz

RAM 8 GB

Hệ điều hành Window 10, 64-bit

Môi trường Microsoft Visual Studio 2017

Community

Các chuỗi video được kiểm thử 2 lần trong cùng một điều kiện và môi trường Các kết quả về thời gian mã hóa của các chuỗi video được thu thập bằng cách lấy trung bình thời gian mã hóa sau 2 lần chạy

Thông số BDBR [9] được sử dụng để đánh giá về mặt hiệu năng của bộ mã hóa Thông số này cho biết lượng bit tiết kiệm khi đánh giá ở cùng mức chất lượng

B Kết quả kiểm thử Bảng V thống kê kết quả kiểm thử so sánh giữa

phương pháp đề xuất với bộ mã hóa video H.266/VVC gốc

Hình 5 cho biết kết quả lựa chọn chế độ dự đoán nội

khung Planar (các khối hình được đánh dấu bằng hình vuông và hình chữ nhật), chế độ dự đoán nội khung DC (các khối hình được đánh dấu bằng hình tròn và hình

elip) khi sử dụng mô hình mã hóa video gốc (Hình 5a)

và khi sử dụng phương pháp đề xuất (Hình 5b) với hệ

số lượng tử QP = 22 Kết quả được thu thập bằng phần mềm Elecard StreamEye [10]

Từ bảng kết quả cho thấy phương pháp đề xuất giúp tiết kiệm thơi gian ở tất cả các chuỗi video kiểm thử, trung bình giảm từ 26.67% đến 28.47% thời gian mã hóa Đặc biệt đối với hai chuỗi video Kimono và

Trang 5

ParkScene (độ phân giải Full-HD) cho kết quả tiết

kiệm từ 29.35% đến 43.42% thời gian mã hóa Trong

khi đó, lượng bit mã hóa trung bình giảm 0.07% khi so

sánh ở cùng mức chất lượng Có thể giải thích việc tiết

kiệm lượng bit mã hóa là do trong quá trình ước lượng

RDCost bằng biến đổi Hadamard, việc giảm số lượng

chế độ dự đoán trong tập các ứng viên đã giúp loại bỏ

đi một số chế độ gây ra sai lệch trong quá trình ước

lượng

Bảng V: Kết quả giảm thời gian mã hóa (∆T) khi sử dụng

phương pháp đề xuất

Chuỗi video

∆T

BD-BR

QP 22 QP 27 QP 32 QP 37 Trung bình

BasketballPass -23.63 -23.88 -24.75 -23.43 -23.92 -0.08

BQSquare -24.72 -27.50 -29.19 -30.14 -27.89 -0.19

BlowingBubbles -24.70 -26.29 -28.11 -28.36 -26.86 -0.07

RaceHorsesD -24.39 -26.48 -26.88 -26.08 -25.96 -0.03

BasketballDrill -19.68 -21.85 -24.95 -21.28 -21.94 -0.12

BQMall -24.75 -26.08 -27.36 -26.96 -26.29 -0.08

PartyScene -24.61 -26.90 -28.43 -28.87 -27.20 -0.12

RaceHorsesC -27.41 -28.19 -29.62 -28.39 -28.40 -0.02

FourPeople -23.59 -24.28 -24.41 -23.57 -23.96 -0.05

Johnny -24.88 -22.92 -20.86 -17.65 -21.58 0.06

Kimono -38.22 -38.73 -33.71 -29.35 -35.00 -0.04

ParkScene -39.48 -41.51 -43.42 -43.41 -41.95 -0.07

Trung bình -26.67 -27.88 -28.47 -27.29 -27.58 -0.07

a) Bộ mã hóa VVC gốc b) Phương pháp đề xuất

Hình 5: Kết quả lựa chọn chế độ dự đoán Planar và DC

cho khung hình thuộc chuỗi video BasketballPass với hệ số

lượng tử QP = 22

V KẾTLUẬN Trong bài báo này, chúng tôi trình bày và phân tích

quá trình lựa chọn hướng dự đoán nội khung trong

chuẩn mã hóa video H.266/VVC, đồng thời đề xuất

một phương pháp giúp làm giảm thời gian mã hóa nội

khung bằng cách giảm số lượng ứng viên chế độ dự

đoán Kết quả kiểm thử cho thấy thời gian mã hóa của

toàn bộ quá trình giảm trung bình từ 26.67% đến

28.47% Hướng nghiên cứu tiếp theo của chúng tôi dự

kiến sẽ kết hợp phương pháp này với các phương pháp

đã được nhóm nghiên cứu đề xuất trước đó nhằm giảm

thời gian xử lý cho quá trình phân chia khối hình [11],

nâng cao chất lượng khung hình tái tạo sau giải mã [12], tích hợp vào mô hình mã hóa video liên lớp SVVC [13], đồng thời áp dụng các kỹ thuật học máy, học sâu tiên tiến để cải thiện hiệu quả của thuật toán

VI LỜICẢMƠN Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và công nghệ Quốc gia (NAFOSTED) trong đề tài

mã số 102.01-2020.15

TÀILIỆUTHAMKHẢO

[1] B Bross, J Chen, J -R Ohm, G J Sullivan and Y -K Wang,

“Developments in International Video Coding Standardization After AVC, With an Overview of Versatile Video Coding (VVC),” in Proceedings of the IEEE, 2020

[2] G J Sullivan, J Ohm, W Han and T Wiegand, “Overview of the High Efficiency Video Coding (HEVC) Standard,” in IEEE Transactions on Circuits and Systems for Video Technology, vol 22, no 12, pp 1649-1668, Dec 2012 [3] F Bossen, et al , “AHG report: Test model software development (AHG3),” in document JVET-X0003, 24th JVET Meeting, by teleconference, 6–15 Oct 2021

[4] A Browne, J Chen, Y Ye and S H Kim, “Algorithm description for Versatile Video Coding and Test Model 14 (VTM 14),” in document JVET-W2002, 23rd JVET Meeting,

by teleconference, 7–16 Jul 2021

[5] W K Pratt, J Kane and H C Andrews, "Hadamard transform image coding," in Proceedings of the IEEE, vol 57, no 1, pp 58-68, Jan 1969

[6] N Zouidi, F Belghith, A Kessentini and N Masmoudi, "Fast intra prediction decision algorithm for the QTBT structure," in IEEE International Conference on Design & Test of Integrated Micro & Nano-Systems (DTS), Gammarth-Tunis, Tunisia,

2019

[7] Y Chen, L Yu, H Wang, T Li, S Wang, “A novel fast intra mode decision for versatile video coding,” in Journal of Visual Communication and Image Representation, vol 71, pp

102849, Aug 2020

[8] VVCSoftware_VTM [Online] Available: https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/-/tree/VTM-14.0

[9] G Bjontegaard, “Calculation of average PSNR differences between RD curves,” in document VCEG-M33, 13th ITU-T VCEG Meeting, VCEG, Austin, TX, USA, Apr 2001 [10] StreamEye [Online] Available:

https://www.elecard.com/products/video-analysis/streameye

[11] Xiem HV, Sang NQ, Minh DB, Minh DN and Duong DT,

"Fast QTMT for H.266/VVC Intra Prediction using Early-Terminated Hierarchical CNN model," in 2021 International Conference on Advanced Technologies for Communications (ATC), HoChiMinh City, Vietnam, 2021

[12] Xiem HV and Hung NH, "Enhancing Quality for VVC Compressed Videos with Multi-Frame Quality Enhancement Model," in 2020 International Conference on Advanced Technologies for Communications (ATC), Nha Trang, Vietnam, 2020

[13] Xiem HV, Sangand F Pereira, "Versatile Video Coding Based Quality Scalability With Joint Layer Reference," in IEEE Signal Processing Letters, vol 27, pp 2079-2083, 2020

Định dạng
Số trang	5
Dung lượng	1,19 MB