Bài viết đề xuất một phương pháp làm giảm độ phức tạp tính toán cho quá trình dự đoán nội khung của mô hình mã hóa video VVC bằng cách giảm số lượng ứng viên trong tập các chế độ dự đoán. Kết quả cho thấy, phương pháp đề xuất giúp làm giảm trung bình từ 26.67% đến 28.47% thời gian xử lý.
Trang 1Phương Pháp Giảm Thời Gian Dự Đoán Nội
Khung Trong Chuẩn Mã Hóa Video
H.266/Versatile Video Coding
Nguyễn Quang Sang1, Bùi Thanh Hương1,2, Đinh Triều Dương1, Hoàng Văn Xiêm1
1Khoa Điện tử Viễn thông, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội
2Khoa Công nghệ thông tin, Trường Đại học Xây dựng
Email: xiemhoang@vnu.edu.vn
Abstract— Vào năm 2020, tiêu chuẩn mã hóa video
H.266/Versatile Video Coding (VVC) đã được ISO và
ITU-T thông qua Để đạt được hiệu năng mã hóa cao
nhất, mô hình mã hóa video này đã được nghiên cứu và
tích hợp nhiều kỹ thuật mã hóa mới Trong đó, đối với
phương pháp dự đoán nội khung, số lượng chế độ dự
đoán được tăng lên 67 chế độ Mặc dù biến đổi
Hadamard được sử dụng giúp làm giảm độ phức tạp tính
toán nhưng so với tiêu chuẩn mã hóa video H.265/High
Efficiency Video Coding (HEVC), thời gian xử lý của
VVC vẫn còn rất cao Trong bài báo cáo này, chúng tôi
đề xuất một phương pháp làm giảm độ phức tạp tính
toán cho quá trình dự đoán nội khung của mô hình mã
hóa video VVC bằng cách giảm số lượng ứng viên trong
tập các chế độ dự đoán Kết quả cho thấy, phương pháp
đề xuất giúp làm giảm trung bình từ 26.67% đến 28.47%
thời gian xử lý
Keywords- H.266/Versatile Video Coding, dự đoán nội
khung, lựa chọn hướng dự đoán
I GIỚITHIỆU Với sự phát triển của công nghệ sản xuất thiết bị
ghi hình và màn hình hiển thị trong những năm trở lại
đây, các ứng dụng video liên tục được nâng cao chất
lượng để tăng tính trải nghiệm cho người dùng Ngày
nay, chúng ta có thể xem được những video với tốc độ
khung hình cao hiển thị chuyển động được mượt mà
hơn, video độ phân giải lớn (HD, Full-HD, 2K, 4K…)
cho hình ảnh sắc nét hơn, video 360o để ghi lại hình
ảnh góc rộng… Tuy nhiên, với những loại hình video
này chất lượng cao này, thách thức đặt ra cho các hệ
thống truyền thông đa phương tiện là lượng dữ liệu vô
cùng lớn trong khi băng thông và khả năng lưu trữ của
thiết bị còn nhiều hạn chế
Để giải quyết các vấn đề cấp thiết trên, từ năm
2015, các tổ chức uy tín trên thế giới đã bắt đầu nghiên
cứu mô hình mã hóa video thế hệ mới mang tên
H.266/Versatile Video Coding (VVC) [1] Mô hình mã
hóa video thế hệ mới này đã được chính thức thông qua
như một tiêu chuẩn mã hóa video vào tháng 7 năm
2020 Các kết quả thử nghiệm chỉ ra rằng, so với tiêu
chuẩn mã hóa video H.265/High Efficiency Video
Coding (HEVC) [2], ở cùng một mức chất lượng, tiêu chuẩn mã hóa video H.266/VVC có thể tiết kiệm tới hơn 40% lượng bit tiêu thụ [3]
Để đạt được hiệu năng mã hóa cao, nhiều kỹ thuật mới đã được nghiên cứu và tích hợp vào bộ mã hóa
H.266/VVC Hình 1 dưới đây mô tả sự khác biệt về các
kỹ thuật được sử dụng trong HEVC và VVC Bên cạnh việc áp dụng cấu trúc phân chia khối hình đa dạng (cây phân chia nhị phân, tam phân, tứ phân - QTMT) ở tất
cả các cấu hình mã hóa, riêng với mã hóa dự đoán nội khung, có thể kể đến số lượng chế độ dự đoán tăng lên
67 (so với 35 chế độ ở HEVC), và một số kỹ thuật mở rộng được áp dụng như kỹ thuật đa đường tham chiếu (multiple-reference line – MRL), kỹ thuật chia nhỏ khối nội khung (intra sub-partition – ISP), kỹ thuật sao chép khối nội khung (intra block copy – IBC) Tuy nhiên, các kỹ thuật này khiến cho bộ mã hóa có độ phức tạp tính toán cao, gây ra độ trễ lớn trong quá trình truyền – nhận dữ liệu Cũng theo số liệu tại báo cáo [3], thời gian xử lý của VVC cao hơn HEVC tới hơn 30 lần
HEVC intra
VVC intra
QT
35 chế độ
dự đoán
QTMT
67 chế độ
dự đoán
MRL ISP IBC
Hình 1 Các kỹ thuật được áp dụng cho chế độ dự đoán nội
khung trong HEVC và VVC
Trong các kỹ thuật nêu trên, có thể thấy việc tăng
số lượng chế độ dự đoán từ 35 lên 67 ảnh hưởng trực tiếp đến việc cải thiện hiệu năng nhưng cũng là nguyên nhân khiến độ phức tạp mã hóa tăng lên đáng kể Việc giảm thời gian xử lý cho dự đoán nội khung luôn là bài toán gây ra nhiều thách thức cho các nhà nghiên cứu
Trang 2khi vừa phải giảm thiểu được độ phức tạp tính toán,
vừa phải đảm bảo được hiệu năng mã hóa không bị ảnh
hưởng Thông qua việc phân tích đặc trưng về kích
thước và mối quan hệ giữa các khối hình lân cận, bài
báo cáo này đề xuất một phương pháp giảm thời gian
mã hóa cho chế độ dự đoán nội khung trong mô hình
mã hóa video H.266/VVC bằng cách giảm số lượng
hướng dự đoán của khối hình
Bài báo cáo được trình bày theo cấu trúc gồm 4
phần Phần 1 giới thiệu tổng quan về mục đích và động
lực nghiên cứu Phần 2 trình bày chi tiết về chế độ dự
đoán nội khung trong mô hình mã hóa video
H.266/VVC và các nghiên cứu giảm thời gian mã hóa
liên quan Trong phần 3 của bài báo cáo, chúng tôi mô
tả về thuật toán được đề xuất Các kết quả kiểm thử và
kết luận được trình bày lần lượt trong phần 4 và 5
II DỰĐOÁNNỘIKHUNGTRONGH.266/VVC
VÀCÁCNGHIÊNCỨULIÊNQUAN
A Dự đoán nội khung trong mô hình mã hóa video
H.266/VVC
Tiêu chuẩn mã hóa video H.266/VVC được nghiên
cứu và chuẩn hóa nhằm hướng tới việc có thể mã hóa
các video độ phân giải cao (Full-HD, 2K, 4K, …), nên
kích thước khối hình tối đa cho phép lên tới 128×128
Do đó, số lượng chế độ dự đoán trong dự đoán nội
khung của VVC lên tới 67 chế độ, bao gồm chế độ
Planar, chế độ DC và 65 hướng trong chế độ dự đoán
theo hướng (Angular Mode) [4] Hình 2 mô tả các chế
độ và hướng dự đoán nội khung trong VVC Các
hướng được ký hiệu bởi mũi tên màu đen là các hướng
giống với hướng trong HEVC Các hướng được ký
hiệu bởi mũi tên màu đỏ là các hướng mới được bổ
sung trong VVC
0: Planar 1: DC
Hình 2: Các chế độ dự đoán nội khung trong VVC
Đối với các khối có dạng hình chữ nhật (N×N,
2N×2N, N×2N, N×3N…), VVC cho phép thay đổi vị
trí giữa các hướng để kết quả dự đoán được tối ưu nhất
Tùy vào tỉ lệ Chiều Rộng / Chiều Cao của khối hình mà
các hướng dự đoán được thay thế khác nhau (Bảng I)
Chế độ này gọi là dự đoán góc rộng (Wide-angle intra
prediction) Hình 3 là một ví dụ sử dụng chế độ dự
đoán góc rộng cho khối hình có tỉ lệ Chiều Rộng / Chiều cao bằng 1/2 và 2
Bảng I: Các hướng bị thay thế trong chế độ dự đoán góc
rộng
Tỉ lệ Chiều Rộng /Chiều Cao (W/H) Các hướng bị thay thế
W / H = 16 Hướng 12, 13,14,15
W / H = 4 Hướng 2,3,4,5,6,7,8,9,10,11
W / H = 2 Hướng 2,3,4,5,6,7,
W / H = 1
W / H = 1/2 Hướng 61,62,63,64,65,66
W / H = 1/4 Hướng 57,58,59,60,61,62,63,64,65,66
W / H = 1/8 Hướng 55, 56
W / H = 1/16 Hướng 53, 54, 55, 56
Hình 3: Ví dụ về dự đoán góc rộng trong VVC
Để giảm thời gian xử lý cho bộ mã hóa, biến đổi Hadamard [5] đã được sử dụng như một phép biến đổi thay thế và ước lượng chi phí RD (RDCost) Các chế
độ dự đoán có giá trị tổng sai khác sau biến đổi (SATD) nhỏ nhất sẽ được bộ mã hóa chọn để tính toán chi phí RD và đưa ra quyết định lựa chọn chế độ dự đoán cho khối hình hiện tại Cụ thể, quy trình lựa chọn chế độ mã hóa trong VVC được tiến hành theo các bước sau:
Bước 1: Tính toán tổng giá trị tuyệt đối sai khác sau
biến đổi (SATD) cho chế độ Planar, DC và các hướng
giống với HEVC (có mũi tên màu đen trong Hình 2),
sử dụng biến đổi Hadamard như công thức (1)
g pred i
SATD= j TH y −y TH (1)
Trong đó: TH là ma trận biến đổi Hadamard, y org là
giá trị pixel gốc, y pred là giá trị pixel dự đoán, TH T là ma
trận chuyển vị của TH
Bước 2: Lựa chọn N hướng có SATD nhỏ nhất (N
phụ thuộc vào kích thước khối hình) và các hướng bên cạnh nó (là các hướng mới trong VVC, có mũi tên màu
đỏ trong Hình 2) để thêm vào tập các ứng viên
Bước 3: Thêm các hướng có xác suất cao nhất cho
dự đoán (Most Probable Mode – MPM) để thêm vào tập các ứng viên Các hướng này là các hướng có tần
Trang 3suất xuất hiện nhiều nhất khi dự đoán các khối hình lân
cận
Bước 4: Tính RDcost cho tập các ứng viên dựa vào
công thức (2) và (3)
org pred i
Trong đó SSD là tổng bình phương sai khác (Sum
Square Different), y org là giá trị pixel gốc, y pred là giá trị
pixel dự đoán, λ là hằng số Lagrange, R là lượng bit
cần để mã hóa
Chế độ dự đoán được bộ mã hóa lựa chọn là chế độ
có giá trị RDCost nhỏ nhất
B Các nghiên cứu giảm thời gian mã hóa cho dự
đoán nội khung trong H.266/VVC
Kể từ khi bắt đầu được triển khai xây dựng bộ mã
hóa vào năm 2015, các nghiên cứu giảm thời gian mã
hóa cho dự đoán nội khung liên tục được công bố
Tác giả Naima Zouidi và cộng sự đề xuất phương
pháp giảm số lượng chế độ dự đoán tại công bố [6]
Dựa vào hệ số lượng tử và độ sâu phân chia nhị phân
của khối hình, bộ mã hóa sẽ đưa ra một danh sách N
chế độ dự đoán nhất định (N<35), qua đó giảm thời
gian tính toán trong quá trình biến đổi Hadamard
Tác giả Yamei Chen [7] và công sự đề xuất phương
pháp kết thúc sớm quá trình lựa chọn chế độ dự đoán
bằng cách sắp xếp lại tập các chế độ dự đoán được lựa
chọn sau khi biến đổi Hadamard Trong quá trình tính
toán RDCost, nếu giá trị RDCost của chế độ hiện tại
lớn hơn một giá trị ngưỡng cho trước thì quá trình lựa
chọn chế độ dự đoán dừng lại
III ĐỀXUẤTPHƯƠNGPHÁPGIẢMTHỜI
GIANDỰĐOÁNNỘIKHUNGTRONGVVC
Như đã trình bày ở phần I, việc tăng số lượng chế độ
dự đoán từ 35 lên 67 là nguyên nhân chính làm tăng
thời gian xử lý trong quá trình dự đoán nội khung của
bộ mã hóa
Để giải quyết bài toán giảm thời gian mã hóa cho
chuẩn mã hóa video H.266/VVC, chúng tôi đề xuất
thuật toán lựa chọn tập các ứng viên cho dự đoán nội
khung dựa trên đặc tính về kích thước khối hình và
thông tin từ các khối hình lân cận
Trước hết, chúng tôi thống kê ở phía giải mã tần suất
được chọn của các chế độ dự đoán được lựa chọn và
nhận thấy chế độ Planar và chế độ DC có tần suất xuất
hiện lớn nhất Kết quả khảo sát 4 chuỗi video được
thống kê tại Bảng II Có thể nhận thấy, tần suất chế độ
Planar được chọn dao động từ 12.19% đến 35.26% tần
suất chế độ DC được chọn dao động từ 14.67% đến
26.49% Đối với chế độ dự đoán theo hướng (hướng số
2 đến hướng số 67), tần suất được lựa chọn dao động từ
44.64% đến 61.46% (trung bình tần suất mỗi hướng từ
0.09% đến 0.12%)
VVC sử dụng cấu trúc cây phân chia tứ phân kết hợp nhị phân và tam phân nên cho phép khối hình mã hóa có kích thước dao động từ 4×4 đến 128×128 Đối với các khối hình có kích thước từ 8×8 trở xuống, giá trị các điểm ảnh trong khối hình không có nhiều sự thay đổi
Bảng II: Tần suất được chọn của các chế độ dự đoán nội
khung
Chuỗi video QP Planar DC Angular Angular TB BasketballPass 22 37 30.32 30.53 17.96 24.83 51.73 44.64 0.10 0.09
RaceHorses 22 37 35.26 29.96 18.87 24.41 45.87 45.63 0.09 0.09
Từ các phân tích và nhận định trên, chúng tôi đề xuất thuật toán giảm thời gian dự đoán nội khung trong H.266/VVC gồm các bước sau:
Bước 1: Kiểm tra kích thước khối hình cần mã hóa
Nếu kích thước khối hình nhỏ hơn hoặc bằng 8×8, thay đổi tập các chế độ dự đoán và tiến hành tính toán RDCost theo các bước đã nêu trong phần II.A Tập các
chế độ dự đoán gồm: {Planar, DC, 2, 18, 34, 50, 66}
Trong đó, chế độ Planar và DC là 2 chế độ có xác suất được lựa chọn nhiều nhất; hướng số 18 và 50 là các hướng theo chiều dọc và chiều ngang; hướng số 2, 34,
66 là hướng dự đoán tới các góc của khối hình (Hình 3) Nếu kích thước khối hình lớn hơn 8×8, chuyển sang
bước 2
Bước 2: Thu thập thông tin về chế độ dự đoán nội
khung của các khối hình lân cận ở các vị trí phía trên, bên trái, góc trên bên trái, góc trên bên phải để thêm vào tập các ứng viên Tiếp tục bổ sung các chế độ Planar, chế độ DC và các chế độ liền kề vào các ứng viên Ví dụ, các chế độ của các khối hình lân cận là {a,
b, c, d} thì tập các ứng viên là {Planar, DC, a-1, a, a+1, b-1, b, b+1, c-1, c, c+1, d-1, d, d+1}
Bước 3: Tính toán giá trị SATD sau khi biến đổi
Hadamard với các chế độ thu được ở bước 2
Bước 4: Chọn ra 2 chế độ có giá trị SATD nhỏ nhất
và các chế độ trong tập MPM để tính toán giá trị RDCost
Bước 5: Lựa chọn chế độ có giá trị RDCost nhỏ
nhất và kết thúc quá trình dự đoán
2 18
0: Planar 1: DC
Hình 3: Các chế độ dự đoán cho khối hình nhỏ hơn hoặc
bằng 8×8
Trang 4Kết Thúc
Kích thước Khối hình <= 8×8
Tập các chế độ dự
đoán gồm: {Planar,
DC, 2, 18, 34, 50,
66}
Tìm kiếm chế độ
dự đoán tốt nhất
theo các bước
trong phần II.A
Thu thập chế độ dự đoán của các khối hình lân cận
Thêm các chế độ Planar, DC và các chế
độ liền kề vào tập ứng viên
Biến đổi Hadamard
Chọn 2 chế độ có SATD nhỏ nhất và các chế độ MPM
Tính toán giá trị RDCost
Đưa ra chế độ dự đoán tốt nhất
Bắt Đầu
Đúng
Sai
Hình 4: Thuật toán giảm thời gian dự đoán nội khung trong
H.266/VVC
IV MÔPHỎNGVÀĐÁNHGIÁKẾTQUẢ
A Điều kiện kiểm thử
Phương pháp đề xuất được thực thi trên phần mềm
tham chiếu VVC Test Model 14 (VTM 14) [8], sử
dụng cấu hình mã hóa All-Intra (AI) ở 4 mức hệ số
lượng tử (QP) 22, 27, 32, 37
Các chuỗi video kiểm thử, môi trường kiểm thử
được thống kê cụ thể ở Bảng III và Bảng IV
Mức độ giảm thiểu về thời gian xử lý của bộ mã hóa
được tính theo công thức (4):
100%
P O O
T
T
−
Trong đó, T O là thời gian xử lý của bộ mã hóa gốc,
T P là thời gian xử lý của bộ mã hóa sử dụng phương pháp đề xuất
Bảng III: Các chuỗi video kiểm thử
Chuỗi video Độ phân giải khung hình Tốc độ
Số khung hình mã hóa
BasketballPass 416×240 50 Hz 500 BQSquare 416×240 60 Hz 600 BlowingBubbles 416×240 50 Hz 500 RaceHorsesD 416×240 30 Hz 300 BasketballDrill 832×480 50 Hz 100 BQMall 832×480 60 Hz 100 PartyScene 832×480 50 Hz 100 RaceHorsesC 832×480 30 Hz 100 FourPeople 1280×720 60 Hz 100 Johnny 1280×720 60 Hz 100 Kimono 1920×1080 24 Hz 100 ParkScene 1920×1080 24 Hz 100
Bảng IV: Cấu hình phần cứng
Bộ vi xử lý Intel® Core™ i7-4800MQ
@2.7 GHz
RAM 8 GB
Hệ điều hành Window 10, 64-bit
Môi trường Microsoft Visual Studio 2017
Community
Các chuỗi video được kiểm thử 2 lần trong cùng một điều kiện và môi trường Các kết quả về thời gian mã hóa của các chuỗi video được thu thập bằng cách lấy trung bình thời gian mã hóa sau 2 lần chạy
Thông số BDBR [9] được sử dụng để đánh giá về mặt hiệu năng của bộ mã hóa Thông số này cho biết lượng bit tiết kiệm khi đánh giá ở cùng mức chất lượng
B Kết quả kiểm thử Bảng V thống kê kết quả kiểm thử so sánh giữa
phương pháp đề xuất với bộ mã hóa video H.266/VVC gốc
Hình 5 cho biết kết quả lựa chọn chế độ dự đoán nội
khung Planar (các khối hình được đánh dấu bằng hình vuông và hình chữ nhật), chế độ dự đoán nội khung DC (các khối hình được đánh dấu bằng hình tròn và hình
elip) khi sử dụng mô hình mã hóa video gốc (Hình 5a)
và khi sử dụng phương pháp đề xuất (Hình 5b) với hệ
số lượng tử QP = 22 Kết quả được thu thập bằng phần mềm Elecard StreamEye [10]
Từ bảng kết quả cho thấy phương pháp đề xuất giúp tiết kiệm thơi gian ở tất cả các chuỗi video kiểm thử, trung bình giảm từ 26.67% đến 28.47% thời gian mã hóa Đặc biệt đối với hai chuỗi video Kimono và
Trang 5ParkScene (độ phân giải Full-HD) cho kết quả tiết
kiệm từ 29.35% đến 43.42% thời gian mã hóa Trong
khi đó, lượng bit mã hóa trung bình giảm 0.07% khi so
sánh ở cùng mức chất lượng Có thể giải thích việc tiết
kiệm lượng bit mã hóa là do trong quá trình ước lượng
RDCost bằng biến đổi Hadamard, việc giảm số lượng
chế độ dự đoán trong tập các ứng viên đã giúp loại bỏ
đi một số chế độ gây ra sai lệch trong quá trình ước
lượng
Bảng V: Kết quả giảm thời gian mã hóa (∆T) khi sử dụng
phương pháp đề xuất
Chuỗi video
∆T
BD-BR
QP 22 QP 27 QP 32 QP 37 Trung bình
BasketballPass -23.63 -23.88 -24.75 -23.43 -23.92 -0.08
BQSquare -24.72 -27.50 -29.19 -30.14 -27.89 -0.19
BlowingBubbles -24.70 -26.29 -28.11 -28.36 -26.86 -0.07
RaceHorsesD -24.39 -26.48 -26.88 -26.08 -25.96 -0.03
BasketballDrill -19.68 -21.85 -24.95 -21.28 -21.94 -0.12
BQMall -24.75 -26.08 -27.36 -26.96 -26.29 -0.08
PartyScene -24.61 -26.90 -28.43 -28.87 -27.20 -0.12
RaceHorsesC -27.41 -28.19 -29.62 -28.39 -28.40 -0.02
FourPeople -23.59 -24.28 -24.41 -23.57 -23.96 -0.05
Johnny -24.88 -22.92 -20.86 -17.65 -21.58 0.06
Kimono -38.22 -38.73 -33.71 -29.35 -35.00 -0.04
ParkScene -39.48 -41.51 -43.42 -43.41 -41.95 -0.07
Trung bình -26.67 -27.88 -28.47 -27.29 -27.58 -0.07
a) Bộ mã hóa VVC gốc b) Phương pháp đề xuất
Hình 5: Kết quả lựa chọn chế độ dự đoán Planar và DC
cho khung hình thuộc chuỗi video BasketballPass với hệ số
lượng tử QP = 22
V KẾTLUẬN Trong bài báo này, chúng tôi trình bày và phân tích
quá trình lựa chọn hướng dự đoán nội khung trong
chuẩn mã hóa video H.266/VVC, đồng thời đề xuất
một phương pháp giúp làm giảm thời gian mã hóa nội
khung bằng cách giảm số lượng ứng viên chế độ dự
đoán Kết quả kiểm thử cho thấy thời gian mã hóa của
toàn bộ quá trình giảm trung bình từ 26.67% đến
28.47% Hướng nghiên cứu tiếp theo của chúng tôi dự
kiến sẽ kết hợp phương pháp này với các phương pháp
đã được nhóm nghiên cứu đề xuất trước đó nhằm giảm
thời gian xử lý cho quá trình phân chia khối hình [11],
nâng cao chất lượng khung hình tái tạo sau giải mã [12], tích hợp vào mô hình mã hóa video liên lớp SVVC [13], đồng thời áp dụng các kỹ thuật học máy, học sâu tiên tiến để cải thiện hiệu quả của thuật toán
VI LỜICẢMƠN Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và công nghệ Quốc gia (NAFOSTED) trong đề tài
mã số 102.01-2020.15
TÀILIỆUTHAMKHẢO
[1] B Bross, J Chen, J -R Ohm, G J Sullivan and Y -K Wang,
“Developments in International Video Coding Standardization After AVC, With an Overview of Versatile Video Coding (VVC),” in Proceedings of the IEEE, 2020
[2] G J Sullivan, J Ohm, W Han and T Wiegand, “Overview of the High Efficiency Video Coding (HEVC) Standard,” in IEEE Transactions on Circuits and Systems for Video Technology, vol 22, no 12, pp 1649-1668, Dec 2012 [3] F Bossen, et al , “AHG report: Test model software development (AHG3),” in document JVET-X0003, 24th JVET Meeting, by teleconference, 6–15 Oct 2021
[4] A Browne, J Chen, Y Ye and S H Kim, “Algorithm description for Versatile Video Coding and Test Model 14 (VTM 14),” in document JVET-W2002, 23rd JVET Meeting,
by teleconference, 7–16 Jul 2021
[5] W K Pratt, J Kane and H C Andrews, "Hadamard transform image coding," in Proceedings of the IEEE, vol 57, no 1, pp 58-68, Jan 1969
[6] N Zouidi, F Belghith, A Kessentini and N Masmoudi, "Fast intra prediction decision algorithm for the QTBT structure," in IEEE International Conference on Design & Test of Integrated Micro & Nano-Systems (DTS), Gammarth-Tunis, Tunisia,
2019
[7] Y Chen, L Yu, H Wang, T Li, S Wang, “A novel fast intra mode decision for versatile video coding,” in Journal of Visual Communication and Image Representation, vol 71, pp
102849, Aug 2020
[8] VVCSoftware_VTM [Online] Available: https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/-/tree/VTM-14.0
[9] G Bjontegaard, “Calculation of average PSNR differences between RD curves,” in document VCEG-M33, 13th ITU-T VCEG Meeting, VCEG, Austin, TX, USA, Apr 2001 [10] StreamEye [Online] Available:
https://www.elecard.com/products/video-analysis/streameye
[11] Xiem HV, Sang NQ, Minh DB, Minh DN and Duong DT,
"Fast QTMT for H.266/VVC Intra Prediction using Early-Terminated Hierarchical CNN model," in 2021 International Conference on Advanced Technologies for Communications (ATC), HoChiMinh City, Vietnam, 2021
[12] Xiem HV and Hung NH, "Enhancing Quality for VVC Compressed Videos with Multi-Frame Quality Enhancement Model," in 2020 International Conference on Advanced Technologies for Communications (ATC), Nha Trang, Vietnam, 2020
[13] Xiem HV, Sangand F Pereira, "Versatile Video Coding Based Quality Scalability With Joint Layer Reference," in IEEE Signal Processing Letters, vol 27, pp 2079-2083, 2020