1. Trang chủ
  2. » Hoá học lớp 12

Kỹ thuật mã hóa video phân tán DVC và ứng dụng kỹ thuật DVC trong mạng cảm biến hình ảnh không dây

49 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 49
Dung lượng 1,44 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Phần dƣ từ khung gốc trừ đi cho khung dự đoán sau đó đƣợc đƣa qua bộ chuyển đổi sang một miền khác, thƣờng đƣợc chuyển đổi sang miền tần số sử dụng phƣơng pháp biến dổi Cosin rời rạc, [r]

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Nguyễn Anh Tuấn

KỸ THUẬT MÃ HÓA VIDEO PHÂN TÁN DVC VÀ ỨNG DỤNG KỸ THUẬT DVC TRONG MẠNG CẢM BIẾN HÌNH

ẢNH KHÔNG DÂY

LUẬN VĂN THẠC SỸ NGÀNH CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ - VIỄN THÔNG

Chuyên ngành: Kỹ thuật viễn thông

HÀ NỘI, 2019

Trang 2

LỜI CAM ĐOAN

Tôi xin cam đoan số liệu và kết quả nghiên cứu trong luận văn này là trung thực

và chưa hề được sử dụng để bảo vệ học vị nào Mọi sự giúp đỡ trong luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc rõ ràng và được phép công bố

Hà Nội, ngày … tháng … năm 2019

Người thực hiện

Nguyễn Anh Tuấn

Trang 3

LỜI CẢM ƠN

Được sự phân công của Khoa Điện tử viễn thông, trường Đại học Công nghệ, dưới sự hướng dẫn của TS Hoàng Văn Xiêm và TS Đinh triều Dương, tôi đã hoàn thành luận văn

Để hoàn thành luận văn này tôi xin cảm ơn các Thầy cô trong Khoa Điện tử viễn thông, trường Đại học Công nghệ đã nhiệt tình dạy dỗ, cung cấp phương pháp, kiến thức trong suốt thời gian học tập Tôi xin chân thành cảm ơn tới hai thầy giáo TS Hoàng Văn Xiêm, TS Đinh triều Dương và Ths Phí Công Huy đã tận tình hướng dẫn

và chỉ bảo tôi rất nhiều cả về kiến thức cũng như phương pháp làm việc trong quá trình thực hiện và hoàn thành luận văn

Mặc dù đã cố gắng và tích cực trong việc thực hiện luận văn nhưng không thể tránh được những sai sót nhất định, tôi rất mong nhận được sự đóng góp của các Thầy

cô và các bạn đồng nghiệp để hoàn chỉnh luận văn và có hướng phát triển hơn nữa Tôi xin chân thành cảm ơn

Trang 4

MỤC LỤC

CÁC THUẬT NGỮ VIẾT TẮT 4

DANH MỤC BẢNG 6

DANH MỤC SƠ ĐỒ, HÌNH VẼ 7

LỜI MỞ ĐẦU 8

1 Lý do lựa chọn đề tài 8

2 Mục đích nghiên cứu 10

3 Đối tượng nghiên cứu 10

4 Phạm vi và phương pháp nghiên cứu 10

5 Cấu trúc luận văn 10

CHƯƠNG I TỔNG QUAN VỀ MÃ HÓA VIDEO DỰ ĐOÁN HEVC VÀ MÃ HÓA PHÂN TÁN DVC 12

1.1 Giới thiệu chung 12

1.2 Mã hóa video dự đoán chuẩn HEVC 13

1.2.1 Sơ đồ cấu trúc 13

1.2.2 Mã hóa trong khung (Intra coding) 16

1.2.3 Mã hóa liên khung (Inter coding) 17

1.2.4 Phép biến đổi cosin rời rạc (DCT) và phép lượng tử 17

1.2.5 Mã hóa entropy 18

1.2.6 Bộ lọc khối và bù thích ứng mẫu SAO 20

1.3 Mã hóa video phân tán (DVC – Distributed Video Coding) 20

1.3.1 Định lý Slepian-Wolf và định lý Wyner-Ziv 20

1.3.2 Kiến trúc mã hóa video phân tán DISCOVER 22

1.4 Kết luận chương 23

CHƯƠNG II XÂY DỰNG MÔ HÌNH MÃ HÓA VIDEO TIÊN TIẾN THẾ HỆ MỚI TRÊN NỀN CHUẨN H.265/HEVC 25

2.1 Kiến trúc mã hóa video phân tán với bộ mã hóa H.265/HEVC 25

2.2 Tạo thông tin phụ 27

2.3 Ứng dụng DVC trong mạng cảm biến hình ảnh không dây 33

2.4 Kết luận chương 34

CHƯƠNG III MÔ PHỎNG VÀ ĐÁNH GIÁ 36

3.1 Điều kiện đánh giá 36

3.2 Đánh giá chất lượng key frames 39

3.3 Đánh giá hiệu năng mã hóa mô hình DVC-HEVC 43

3.4 Kết luận chương 45

KẾT LUẬN 46

TÀI LIỆU THAM KHẢO 47

Trang 5

CÁC THUẬT NGỮ VIẾT TẮT

A AVC Advance Video Coding Mã hóa video mở rộng

B BCH Bose Chaudhuri

Hocquenghem

Mã Bose Chaudhuri Hocquenghem

C

CABAC Content Adaptive Binary

Arithmetic Coding

Mã hóa số học nhị phân thích ứng ngữ cảnh

CB Coding Block Khối mã hóa

CNM Correlated Noise

Modeling Mô hình nhiễu tương quan CTB Coding Tree Block Khối cây mã hóa CTU Coding Tree Unit Đơn vị cây mã hoá

CU Coding Unit Đơn vị mã hóa

HDR High dynamic range Dải động cao

HEVC High Efficiency Video

Coding Mã hóa video hiệu quả cao HFR High frame rate Tốc độ khung hình cao

HVC Hybrid Video Coding Khung mã hóa video kết

Trang 6

MCTI Motion Compensation

Temporal

Nội suy tạm thời bù chuyển

động

ME Motion Estimation Ƣớc lƣợng chuyển động

MPEG Moving Picture Experts

S SAO Sample Adaptive Offset Bù thích ứng mẫu

SI Side Information Thông tin phụ trợ

T

TB Transform Block Khối biến đổi

TDWZ Transform Domain

Wyner-Ziv Wyner-Ziv miền biến đổi

TU Transform Unit Đơn vị biến đổi

U UHD Ultra-high definition Độ phân giải siêu cao

V VLC Variable Length Code Mã có chiều dài thay đổi

W WCG Wide color gamut Gam màu rộng

Trang 7

DANH MỤC BẢNG

Bảng 1.1: Giá trị lượng tử và xác suất tương ứng 19

Bảng 1.2: Mã Huffman và số lượng bit cần mã hóa tương ứng 19

Bảng 2.1: Các mức tiêu thụ năng lượng trong mã hóa dự đoán và phân tán 34

Bảng 3.1: Bảng mô tả tóm tắt các thông số sử dụng đánh giá 37

Bảng 3.2: Giá trị lượng tử cho khung chính tại GOP=2, QCIF 15Hz 38

Trang 8

DANH MỤC SƠ ĐỒ, HÌNH VẼ

Mã hóa video truyền thống và mã hóa video phân tán 9

Hình 1.1: Sơ đồ cấu trúc mã hóa video theo chuẩn HEVC 13

Hình 1.2: Kỹ thuật phân vùng trong HEVC 15

Hình 1.3: Các chế độ và các hướng cho dự đoán hình trong khung [8] 17

Hình 1.4: Giá trị điểm ảnh trong miền pixel và miền DCT tương ứng 18

Hình 1.5: Mô hình phép lượng tử tuyến tính 18

Hình 1.6: Cây mã huffman 19

Hình 1.7: Biểu đồ vùng tỷ lệ tốc độ mã giữ hai nguồn X,Y 22

Hình 1.8 Kiến trúc mã hóa video phân tán DVC DISCOVER[2] 23

Hình 2.1: Cấu trúc mã hóa DVC-HEVC 25

Hình 2.2: Quá trình nội suy khung 28

Hình 2.3: Lựa chọn vectơ chuyển động 30

Hình 2.4: Ước lượng chuyển động hai chiều 30

Hình 2.5: Quá trình nội suy khung kết hợp ước lượng chuyển động trước và sau 32

Hình 3.1: Mô tả khung hình đầu tiên của 4 chuỗi video 37

Hình 3.2: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC (Chuỗi video Foreman) 40

Hình 3.3: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC (Chuỗi video Hall monitor) 40

Hình 3.4: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC (Chuỗi video Coastguard) 41

Hình 3.5: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC (Chuỗi video Soccer) 41

Hình 3.6: Đánh giá chất lượng khung hình giữa H.264/AVC và H.265/HEVC (Video Foreman) 42

Hình 3.7: Đánh giá chất lượng khung hình giữa H.264/AVC và H.265/HEVC (Video coastguard) 42

Hình 3.8: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC 43

(Video Foreman) 43

Hình 3.9: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC 43

(Video Hall monitor) 43

Hình 3.10: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC 44

(Video Coastguard) 44

Hình 3.11: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC 44

(Video Soccer) 44

Trang 9

LỜI MỞ ĐẦU

1 Lý do lựa chọn đề tài

Video chiếm khoảng 75% dữ liệu được truyền tải trong mạng trên toàn thế giới

và tỷ lệ này vẫn đang tăng lên đều đặn và dự kiến sẽ tiếp tục phát triển hơn nữa trong tương lai Trong khi đó, việc giới thiệu các video với độ phân giải siêu cao (ultra-high definition - UHD), dải động cao (high dynamic range - HDR), gam màu rộng (Wide color gamut - WCG), tốc độ khung hình cao (High frame rate - HFR) và các dịch vụ video trong tương lai sẽ gia tăng đáng kể thách thức Do đó, nhu cầu về các công nghệ

mã hóa (nén) video hiệu quả luôn luôn cấp bách

Kể từ khi khái niệm mã hóa kết hợp được đề xuất bởi Habibi [1] vào năm 1974

và khung mã hóa không gian-thời gian kết hợp của Forchheimer vào năm 1981, khung

mã hóa video kết hợp (Hybrid Video Coding - HVC) đã được áp dụng rộng rãi vào các chuẩn mã hóa hình ảnh/video phổ biến nhất hiện có như JPEG, H.261, MPEG2, H.264/AVC và H.265/HEVC, v.v Hiệu suất mã hóa video được cải thiện khoảng 50% cứ sau 10 năm cùng với đó là sự tăng lên độ phức tạp tính toán và bộ nhớ Và hiện tại đã gặp phải những thách thức lớn để cải thiện đáng kể hiệu quả mã hóa nhằm đáp ứng yêu cầu kỹ thuật của các ứng dụng phương tiện thông minh và công nghệ hiện đại như nhận diện khuôn mặt/cơ thể, theo dõi đối tượng, truy xuất hình ảnh, v.v

Với sự tăng lên nhanh chóng của các thiết bị video, từ máy quay cầm tay đến mạng cảm biến video công suất thấp và điện thoại di động được trang bị đa phương tiện, mã hóa độ phức tạp thấp trở nên quan trọng để đáp ứng với công suất và mức tiêu hao năng lượng của các thiết bị di động Để đáp ứng những nhu cầu này cho truyền thông video, mã hóa video phân tán (Distributed Video Coding – DVC) [2], một mô hình mã hóa video được phát triển dựa trên lý thuyết Slepian-Wolf và Wyner-Ziv [3]

DVC có thể được phát triển theo một trong hai cách tiếp cận chính Cách tiếp cận đầu tiên, đề xuất bởi nhóm nghiên cứu ở trường Đại học Stanford [4], theo hướng

mã hóa toàn khung hình Mỗi video đầu vào được chia tách tách thành hai loại, khung hình chính (Key frame) và khung hình Wyner-Ziv (WZ frame) Trong khi các khung chính được mã hóa bới các bộ mã hóa chuẩn với cấu hình phức tạp thấp (H.263 Intra hoặc H.264/AVC Intra), các khung WZ được mã hóa sử dụng các bộ mã hóa kênh như

Trang 10

mã turbo hoặc mã LDPC [5], kết hợp với ước lượng giá trị của khung hình tại phía thu

Cách tiếp cận thứ hai là theo phương pháp mã hóa khối – PRISM [6], trong đó cùng

với các khối được mã hóa theo phương pháp truyền thống như mã hóa trong khung

(intra coding) kết hợp với mã kênh BCH Một đặc điểm chung của cả hai cách tiếp cận

này là bộ mã hóa sẽ dịch chuyển các phần phức tạp như ước lượng chuyển động từ

phía phát sang phía thu

Hình dưới mô tả tổng quan việc xử lý thông tin video theo phương pháp dự

đoán truyền thồng và phương pháp phân tán Trong phương pháp truyền thống, video

được tạo dự đoán tại cả phía phát và phía thu, thông tin dư thừa được xác định tại phía

phát sẽ được gửi đi, do vậy, phía phát sẽ phải làm rất nhiều nhiệm vụ phức tạp Trong

khi đó, với phương pháp mã hóa video phân tán , phía thu sẽ đảm nhiệm vai trò tạo dự

đoán, thông qua một bộ tạo thông tin phụ (Side information) như mô tả ở các chương

sau Phía phát chỉ đơn giản truyền đi sự khác biệt tương quan giữa thông tin gốc và

thông tin phụ tại phía thu Do vậy, thời gian mã hóa sẽ được giảm đi đáng kể

a Mã hóa video truyền thống

b Mã hóa video phân tán

Mã hóa video truyền thống và mã hóa video phân tán

Sự ra đời gần đây của chuẩn mã hóa H.265/HEVC [7], với khoảng 50% lượng

bit yêu cầu thấp hơn so với chuẩn H.264/AVC [8] đã tạo động lực để tiếp tục các

nghiên cứu cải tiến cho mô hình mã hóa phân tán DVC Trên cơ sở đó, luận văn này

tập trung nghiên cứu và xây dựng một mô hình mã hóa video phân tán thế hệ mới, trên

nền tảng chuẩn H.265/HEVC và mô hình tạo thông tin phụ mới

Y

Trang 11

2 Mục đích nghiên cứu

Luận văn tập trung tìm hiểu về chuẩn mã hóa video thế hệ mới H.265/HEVC [7], mô hình mã hóa video phân tán DVC và từ đó nghiên cứu, đề xuất nhằm cải tiến thông tin phụ đối với mã hóa video thế hệ mới H.265/HEVC [7]

3 Đối tượng nghiên cứu

Nghiên cứu, cải thiện chất lượng thông tin phụ trong mô hình DVC

- Mô hình mã hóa video phân tán DVC-HEVC

- Các chuỗi video với khung hình thước nhỏ do sử dụng mã video phân tán

4 Phạm vi và phương pháp nghiên cứu

Luận văn đưa ra cái nhìn tổng quan về mã hóa video dự đoán chuẩn HEVC, mã hóa video phân tán DVC, mô hình DVC dựa trên kiến trúc DISCOVER [2, 9] Từ mô hình kiến trúc DISCOVER, luận văn sẽ tập trung vào cách hình thành nên thông tin phụ

Phương pháp nghiên cứu:

- Khảo sát và nghiên cứu lý thuyết

- Phương pháp thu thập thông tin bằng cách nghiên cứu tài liệu kết hợp với kết quả thực nghiệm

- Tìm hiểu mô hình mã hóa video dự đoán chuẩn H.265/HEVC và mô hình mã hóa video phân tán DVC

- Nghiên cứu và đưa ra cải tiến tạo thông tin phụ

- Phân tích và đánh giá

5 Cấu trúc luận văn

Nội dung chính của luận văn được trình bày qua 5 chương:

Chương 1: Tổng quan về mã hóa video dự đoán HEVC và mã hóa phân tán DVC

Chương này giới thiệu về bối cảnh của nghiên cứu mã hóa video và cấu trúc tổng quan mã hóa video

Trang 12

Chương 2: Xây dựng mô hình mã hóa video tiên tiến thế hệ mới trên nền chuẩn H.265/HEVC

Chương này trình bày về kiến trúc tổng quan mã hóa video phân tán sử dụng HEVC cho mã hóa intra và sau đó đưa ra mô hình tạo thông tin phụ mới, ứng dụng của

mã hóa DVC trong việc giúp cải thiện năng lượng tiêu thụ của các cảm biến

Chương 3: Mô phỏng và đánh giá

Chương này sẽ đưa ra các kịch bản mô phỏng và đánh giá tính hiệu quả của mô hình mã hóa video phân tán thế hệ mới, DVC-HEVC

Kết luận

Kết luận sẽ tổng quát lại những kết quả lý thuyết và mô phỏng từ chương 1,2,3 và đưa ra những nhận xét

Trang 13

CHƯƠNG I TỔNG QUAN VỀ MÃ HÓA VIDEO DỰ ĐOÁN HEVC VÀ MÃ HÓA PHÂN TÁN DVC

1.1 Giới thiệu chung

Những năm gần đây, truyền tải và lưu trữ video càng trở lên phổ biến hơn do một số yếu tố như giá thành các sản phẩm liên quan như máy quay video HD, TV màn hình lớn, các thiết bị lưu trữ… đang giảm rất nhanh Bên cạnh đó, các bộ vi xử lý mới

có tốc độ cao hơn rất nhiều, cùng với tốc độ internet được cải thiện đáng kể giúp việc tải một bộ phim nhanh chóng cũng như trải nghiệm mượt mà hơn

Nhu cầu trải nghiệm video ngày càng lớn, trước đây việc thưởng thức các bộ phim ở độ phân giải 480p rồi đến mHD 720p đã là thỏa mãn, thì giờ đây các phim độ phân giải Full HD 1080p đã ngày một nhiều hơn Nhu cầu đó càng thể hiện mạnh mẽ hơn khi 2 năm gần đây xuất hiện các TV với công nghệ hình ảnh 4K với độ phân giải siêu cao Các thiết bị lưu trữ và đường truyền internet với áp lực phải lớn hơn đã không kịp đáp ứng và đòi hỏi cần có một chuẩn nén video mới hiệu quả hơn nhằm giảm tải cho áp lực này

Với hình ảnh độ phân giải Full HD (FHD) 1920x1080, chuẩn nén H.264 có thể

dễ dàng thực hiện tiến trình làm việc hay quá trình nén – giải mã tín hiệu Tuy nhiên ngày nay FHD đang bị thay thế dần bởi độ phân giải 4K x 2K (3840x2610) và H.264

có vẻ bị tụt hậu và phát sinh nhiều lỗi trước các độ phân giải cao này Vấn đề còn tệ hơn nữa với việc xuất hiện độ phân giải rất cao 8K x 4K (7680x4320) hay còn được gọi là Ultra HD, H.264 đang gặp vấn đề về dung lượng lưu trữ và đặc biệt là quá trình

xử lý các hình ảnh độ nét cao hoặc gần như tối đa Hay nói cách khác, xử lý các hình ảnh độ phân giải cao 4K là nhiệm vụ bất khả thi với H.264 [8]

H.265 hay HEVC (High Efficiency Video Coding) [7] được Ủy ban Viễn thông Quốc tế ITU-T thông qua và bắt đầu được các nhà phát triển đưa vào sản phẩm thương mại H.265 hứa hẹn mang lại khả năng nén cao gấp đôi so với người tiền nhiệm H.264/AVC (Advance Video Coding) [8] hiện đang được dùng phổ biến (chiếm tới 80% các nội dung video lưu trữ hiện nay) Với khả năng này H.265 giúp giảm băng thông cần thiết để truyền tải phim, giảm dung lượng lưu trữ và chúng ta phải trả ít tiền

Trang 14

hơn cho băng thông internet và thiết bị lưu trữ Ưu điểm vượt trội này cũng sẽ là cú hích cho thị trường thiết bị nghe nhìn 4K/UHD

Trong tương lai, với các đoạn video trên youtube, facebook chúng ta có thể xem với hình ảnh cực nét mà không cần phải chờ đợi để tải về nữa

Vào ngày 29/2/2012, tại triển lãm Mobile World Congress, hãng Qualcomm đã trình chiếu hiệu năng của bộ nén mới trên tablet khi mà chuẩn nén mới đã cho chất lượng hiện thị tương đương với dung lượng gần như giảm một nửa

1.2 Mã hóa video dự đoán chuẩn HEVC

1.2.1 Sơ đồ cấu trúc

Hình 1.1 mô tả sơ đồ kiến trúc mã hóa video theo chuẩn HEVC [7]

Hình 1.1: Sơ đồ cấu trúc mã hóa video theo chuẩn HEVC

Trong HEVC, mỗi ảnh đầu vào được chia thành các khối ảnh, sau đó được mã hóa và được truyền tải đến các bộ giải mã Ảnh đầu tiên của một chuỗi video được mã hoá chỉ sử dụng dự đoán trong khung Đối với các ảnh còn lại của chuỗi sử dụng các chế độ mã hóa dự đoán liên khung theo thời gian Quá trình mã hóa cho dự đoán liên

Bộ điều khiển chung

Biến đổi

Tỷ lệ Lượng tử

Ước lượng hình ảnh

Dự đoán hình ảnh

Bù chuyển động

Ước lượng chuyển động

Tỷ lệ và biến đổi ngược

Phân tích điều khiển bộ lọc

Tạo khối và lọc dữ liệu

-Bộ điều khiển

dữ liệu chung

Dự đoán dữ liệu

Điều khiển lọc dữ liệu

Dữ liệu chuyển động

Hình ảnh được giải mã và lưu trong bộ đệm

Lượng tử Biến đổi

Tỷ lệ

Đầu ra cho video

Định dạng tiêu đề và CABAC Luồng dữ

liệu nhị phân được

Trang 15

khung sẽ lựa chọn dữ liệu chuyển động bao gồm các ảnh tham chiếu và vector chuyển động (MV) dùng để dự đoán các mẫu của mỗi khối ảnh Các bộ mã hóa và giải mã tạo

ra tín hiệu dự đoán liên khung giống nhau bằng cách sử dụng kỹ thuật bù chuyển động (MC) và thông tin phụ (side informartion) là dữ liệu để quyết định chế độ Các tín hiệu

dư thừa của dự đoán trong khung và liên khung sẽ được biến đổi bởi phép biến đổi không gian tuyến tính Sau đó các hệ số biến đổi được định cỡ (scale), lượng tử hóa,

mã hóa entropy, và được truyền cùng với các thông tin dự đoán

Đồng thời, bộ mã hóa cũng bao gồm cả phần xử lý giải mã sao cho cả hai phía

mã hóa và giải mã cùng tạo ra các dự đoán giống nhau đối với ảnh kế tiếp Do đó, các

hệ số biến đổi lượng tử sẽ được tạo lại qua định cỡ ngược và biến đổi ngược để tạo lại gần đúng tín hiệu dư thừa Sau đó các tín hiệu dư thừa này cộng với các tín hiệu dự đoán và được đưa vào một hoặc hai bộ lọc để làm mịn ảnh Ảnh biểu diễn cuối cùng (một bản sao của đầu ra của bộ giải mã) được lưu trữ trong một bộ đệm ảnh giải mã và được sử dụng để dự đoán các ảnh tiếp theo

Đối với các chuẩn mã hóa trước đó, khung ảnh được chia thành các đơn vị mã hóa là các macroblock, bao gồm một khối 16x16 các mẫu thành phần chói và các khối 8x8 các mẫu thành phần màu, trong khi đó các cấu trúc tương tự trong HEVC là đơn vị cây mã hóa (CTU) Cụ thể, ảnh được chia thành các CTU, mỗi CTU bao gồm các CTB chói và các CTB màu Một CTB có kích thước là 16, 32 hoặc 64, trong đó các kích thước lớn hơn cho phép nén tốt hơn HEVC hỗ trợ việc phân chia các CTB thành các khối nhỏ hơn sử dụng cấu trúc cây và tín hiệu hóa cây tứ phân

 Đơn vị mã hóa (CU – Coding Unit) và khối mã hóa (CB – Coding Block)

Cú pháp cây tứ phân (quadtree syntax) chứa trong CTU cho phép chia các CB

có kích cỡ và vị trí thích hợp dựa trên đặc tính tín hiệu của vùng tạo bởi CTB, do đó gốc của cây tứ phân là CTU Thông thường, kích cỡ của CB được xác định như sau: 8x8 < kích cỡ CB size < kích cỡ CTB Khi đó, đơn vị mã hóa CU sẽ gồm 1 CB chói và

2 CB màu, cùng cú pháp đi kèm Một CTB có thể chứa chỉ một CU hoặc được phân chia thành nhiều CU, và mỗi CU có một phân vùng liên quan đến các đơn vị dự báo (PUs) và một cây các đơn vị biến đổi (TUs)

Trang 16

 Đơn vị dự đoán (PU) và khối dự đoán (PB)

Quyết định việc mã hóa một vùng ảnh sử dụng dự đoán liên khung hoặc dự đoán trong khung được thực hiện ở mức CU Cấu trúc phân chia PU có gốc ở mức CU Tùy thuộc vào kiểu dự đoán mà các CB chói và màu sau đó có thể được phân chia thành các khối dự đoán (PB): chói và màu Mỗi một PB sẽ chứa một vector chuyển động

 Đơn vị biến đổi (TU) và khối biến đổi (TB)

Dư thừa dự đoán được mã hóa sử dụng các biến đổi khối Cấu trúc cây TU có gốc ở mức CU Dư thừa CB chói có thể giống với khối biến đổi (TB) chói hoặc tiếp tục chia thành các TB chói nhỏ hơn Điều tương tự áp dụng cho các TB màu Hàm số nguyên tương tự như hàm biến đổi cosin rời rạc (DCT) được xác định cho các TB có kích thước 4x4, 8x8, 16x16, và 32x32

Hình 1.2: Kỹ thuật phân vùng trong HEVC

Trang 17

1.2.2 Mã hóa trong khung (Intra coding)

Dự đoán trong khung hoạt động theo kích thước TB, và các mẫu biên giải mã trước đó từ những TB lân cận về mặt không gian được sử dụng để tạo ra tín hiệu dự đoán Dự đoán trong ảnh hỗ trợ 33 hướng khác nhau với các kích thước TB từ 4x4 đến 32x32 Các hướng dự đoán được thể hiện trong hình 1.3 Ngoài ra dự đoán mặt phẳng

và dự đoán DC cũng có thể được sử dụng Đối với thành phần màu, chế độ dự đoán ngang, dọc, mặt phẳng và DC có thể được báo hiệu một cách rõ ràng, hoặc chế độ dự đoán thành phần màu được chỉ định giống các chế độ dự đoán thành phần chói

Mỗi CB được mã hóa bằng một trong những loại mã hóa, tùy thuộc vào loại mảng Tương tự như H.264 / MPEG-4 AVC, mã hóa dự đoán trong khung được hỗ trợ trong tất cả các loại mảng HEVC hỗ trợ các phương pháp mã hóa dự đoán trong ảnh khác nhau gọi là Intra_Angular, Intra_Planar, and Intra_DC

Một CB dự đoán trong khung có kích thước MxM có thể có một trong hai loại phân chia PB gọi là PART_2Nx2N và PART_NxN, loại đầu tiên chỉ ra rằng các CB không phân chia và loại thứ hai chỉ ra rằng CB được chia thành bốn PB kích thước bằng nhau (N = M / 2) Tuy nhiên, nó có khả năng biểu diễn các vùng tương tự mà có thể được xác định bởi bốn PB bằng cách sử dụng bốn CB nhỏ hơn khi kích thước của các CB hiện tại lớn hơn so với kích thước CU tối thiểu Vì vậy, HEVC chỉ cho phép kiểu phân chia PART_NxN được sử dụng khi kích thước CB hiện tại bằng với kích thước CU tối thiểu Điều này có nghĩa rằng kích thước PB luôn bằng với kích thước

CB khi CB được mã hóa bằng chế độ dự đoán trong khung và kích thước CB là không bằng với kích thước CU tối thiểu Dù chế độ dự đoán trong khung ở mức PB, nhưng các quá trình dự đoán thực tại lại hoạt động riêng biệt cho từng TB

Trang 18

Hình 1.3: Các chế độ và các hướng cho dự đoán hình trong khung [8]

1.2.3 Mã hóa liên khung (Inter coding)

Dự đoán ảnh liên khung trong chuẩn H.265/HEVC cũng cho phép hỗ trợ dự đoán vectơ chuyển động với độ chính xác lên tới ¼ điểm ảnh (sub-pel) Các giá trị tại

vị trí sub-pel được nội suy dựa trên hai bô lọc với 7 hoặc 8 tham số cấu hình Các khối hình sử dụng trong dự đoán ảnh liên khung cũng đa dạng, có thể đối xứng hoặc không đối xứng, ví dụ: 2N×2N, 2N×N, N×2N, N×N, 2N×nD, nL×2N

1.2.4 Phép biến đổi cosin rời rạc (DCT) và phép lượng tử

Phần dư từ khung gốc trừ đi cho khung dự đoán sau đó được đưa qua bộ chuyển đổi sang một miền khác, thường được chuyển đổi sang miền tần số sử dụng phương pháp biến dổi Cosin rời rạc, mục đích của việc chuyển đổi này là để tách biệt các thành phần tần số thấp và loại bỏ được thông tin ở thành phần tần số cao, vì vậy thông tin mã hóa sẽ được giảm bớt, việc loại bỏ thông tin tại các thành phần tần số cao thường ít ảnh hưởng tới cảm nhận của mắt người về chất lượng hình ảnh

Trang 19

Hình 1.4: Giá trị điểm ảnh trong miền pixel và miền DCT tương ứng

Các thành phần tấn số cao thường không nhạy cảm đối với mắt người và việc loại bỏ các thành phần tần số này sẽ thực hiện thông qua phép lượng tử hóa Mục đích chính của phép lượng tử hóa là chuyển đổi tín hiệu vào tới các mức lượng tử, tín hiệu vào ở đây là các hệ số DCT Như vậy, bằng việc lượng tử hóa, nhiều giá trị DCT có giá trị tương đương nhau sẽ được chuyển đổi về một giá trị lượng tử, giúp cho lượng thông tin cần mã hóa được giảm bớt

Hình 1.5: Mô hình phép lượng tử tuyến tính

1.2.5 Mã hóa entropy

Giá trị lượng tử sẽ là một chuỗi ký tự các số nguyên, để truyền tải chuỗi ký tự này ta phải chuyển đổi sang chuỗi số nhị phân 0 và 1 Mã hóa entropy sẽ được áp dụng cho từng khối ảnh, từng giá trị lượng tử với độ dài phù hợp Ví dụ: mã Huffman gán một VLC (Variable-length coding) cho mỗi ký hiệu dựa trên xác suất xuất hiện của các

Trang 20

ký hiệu Theo đó chúng ta cần phải tính xác suất xuất hiện của mỗi ký hiệu và xây dựng một bộ từ mã có độ dài thay đổi, ví dụ đƣợc đƣa ra nhƣ bảng sau:

Bảng 1.1: Giá trị lượng tử và xác suất tương ứng

Bảng 1.2: Mã Huffman và số lượng bit cần mã hóa tương ứng

Trang 21

Trong H.265/HEVC, mã hóa số học nhị phân thích ứng ngữ cảnh (CABAC) được sử dụng để mã hóa entropy Nó tương tự như các sơ đồ CABAC trong H.264 / MPEG-4 AVC, nhưng có thêm một số cải tiến để cải thiện tốc độ lưu lượng (đặc biệt

là cho các kiến trúc xử lý song song), hiệu suất nén, và để giảm bộ nhớ ngữ cảnh của

1.2.6 Bộ lọc khối và bù thích ứng mẫu SAO

Một bộ lọc khối giống như bộ lọc trong H.264 /AVC, H.265/HEVC, bộ lọc này được sử dụng để làm giảm các nhiễu khối.Tuy nhiên, thiết kế được đơn giản hóa đối với quá trình đưa ra quyết định và lọc, và được làm thuận lợi hơn để xử lý song song

Bù thích ứng mẫu SAO là một ánh xạ biên độ phi tuyến tính được đưa vào trong vòng lặp dự đoán liên ảnh đằng sau bộ lọc khối Mục đích là để tái tạo tốt hơn các biên độ tín hiệu ban đầu bằng cách sử dụng một bảng look-up , bảng này được mô

tả bằng một vài thông số bổ sung mà chúng có thể được xác định bằng cách phân tích biểu đồ ở phía bộ mã hóa

1.3 Mã hóa video phân tán (DVC – Distributed Video Coding)

Gọi tốc độ mã hóa là , là entropy của nguồn là tốc độ mã hóa tối thiểu để khôi phục chính xác nguồn X tại bộ giải mã Với hai nguồn

Trang 22

độc lập và Tốc độ mã hóa tối thiểu cho từng nguồn để giải mã không lỗi chính là entropy của từng nguồn và

Với hai nguồn thống kê phụ thuộc thì tính chất của Entropy đồng thời:

- | : là entropy có điều kiện đặc trưng cho độ bất định về nguồn tin

Y khi biết nguồn tin X

Trong trường hợp cần mã hóa độc lập và thì tốc độ mã hóa tối thiểu sẽ là

(4)

So sánh với bộ mã hóa độc lập: bộ mã hóa độc lập bỏ qua sự tương quan nguồn

sẽ cần tốc độ tối thiểu như điều kiện (3) Tuy nhiên, với mã Slepian-Wolf, bộ mã hóa khai thác được sự tương quan giữa các nguồn, do vậy tốc độ mã hóa đạt được tương đương với mã hóa liên kết

Trang 23

theo như biểu đồ Slepian-Wolf, tốc độ mã hóa X có thể đạt được về mặt

lý thuyết | ( nhỏ tùy ý)

Hình 1.7: Biểu đồ vùng tỷ lệ tốc độ mã giữ hai nguồn X,Y

1.3.2 Kiến trúc mã hóa video phân tán DISCOVER

Hình 1.8 mô tả kiến trúc mã hóa video phân tán DVC, đề xuất và cải tiến bởi nhóm nghiên cứu F Pereira [2], với tên gọi DISCOVER

Đây là kiến trúc mã hóa video phân tán phổ biến và đã được kiểm chứng là có hiệu quả nhất so với các mô hình trước đó

Trang 24

Hình 1.8 Kiến trúc mã hóa video phân tán DVC DISCOVER[2]

Trong bộ mã hóa DVC DISCOVER, chuỗi video được chia thành hai chuỗi chính: các khung WZ và các khung chính Trong khi các khung chính được mã hóa với chuẩn H.264/AVC, cấu hình Intra coding, thì các khung WZ được mã hóa theo phương pháp mã hóa kênh, đề xuất bởi trưởng Đại học Stanford [4]

Mặc dù bộ mã hóa DISCOVER cung cấp hiệu năng mã hóa cao, các nghiên cứu gần đây với sự ra đời của chuẩn HEVC đã cho thấy cần phải có các cải tiến hơn nữa

mô hình mã hóa video phân tán Đặc biệt là sự kế thừa các kết quả nghiên cứu của chuẩn HEVC Trên cơ sở đó, chương 2 của luận văn sẽ mô tả một mô hình mã hóa video phân tán thế hệ mới, phát triển trên nền tảng chuẩn HEVC, với một số cải tiến nhỏ tại khối tạo thông tin phụ

1.4 Kết luận chương

Chương I đã giới thiệu và đề cập nhu cầu của mã hóa video ngày càng cao trong bối cảnh độ phân giải Full HD 1080p đã ngày một nhiều hơn Nhu cầu đó càng thể hiện mạnh mẽ hơn khi gần đây xuất hiện các TV với công nghệ hình ảnh 4K với độ phân giải siêu cao Các thiết bị lưu trữ và đường truyền internet phải chịu nhiều áp lực hơn để đáp ứng được các chuẩn phân giải mới Trong bối cảnh đó, chuẩn mã hóa video HEVC được ra đời để đáp ứng yêu cầu

Sơ đồ bộ mã hóa HEVC được mô tả trong chương này và các kỹ thuật cơ bản của mã hóa video cơ bản bao gồm mã hóa trong khung, mã hóa liên khung, phép biến

Ngày đăng: 28/01/2021, 22:21

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] A. Habibi, “Hybrid coding of pictorial data”, IEEE Transactions on Communications, vol. 22, no. 5, pp. 614–624, May 1974 Sách, tạp chí
Tiêu đề: Hybrid coding of pictorial data”, "IEEE Transactions on Communications
[2] C. Brites and F. Pereira, “Distributed video coding: Bringing new applications to life”, 5 th Conference on Telecommunications – ConfTele, Apr. 2005 Sách, tạp chí
Tiêu đề: Distributed video coding: Bringing new applications to life”, "5"th" Conference on Telecommunications – ConfTele
[3] D. Slepian and J. Wolf, “Noiseless coding of correlated information sources”, IEEE Transactions on Information Theory, vol. 19, no. 4, pp. 471-480, 1973 Sách, tạp chí
Tiêu đề: Noiseless coding of correlated information sources”, "IEEE Transactions on Information Theory
[4] B. Girod, A. Aaron, S. Rane, and D. Rebollo-Monedero, “Distributed Video Coding,” Proceedings of the IEEE, vol. 93, no. 1, pp. 71–83, Jan. 2005 Sách, tạp chí
Tiêu đề: Distributed Video Coding,” "Proceedings of the IEEE
[5] A. D. Liveris, “Compression of binary sources with side information at the decoder using LDPC codes,” IEEE Communication Letters, vol. 6, no. 10, October 2002 Sách, tạp chí
Tiêu đề: Compression of binary sources with side information at the decoder using LDPC codes,” "IEEE Communication Letters
[6] R. Puriand and K. Ramchandran, “PRISM: a new robust video coding architecture based on distributed compression principles”, Proceedings of the 40th Allerton Conference Communication, Control and Computing, 2002 Sách, tạp chí
Tiêu đề: PRISM: a new robust video coding architecture based on distributed compression principles”, "Proceedings of the 40th Allerton Conference Communication, Control and Computing
[7] G.J. Sullivan et al, „Overview of the High Efficiency Video Coding (HEVC) Standard‟, IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, no. 12, pp.1649-1668, 2012 Sách, tạp chí
Tiêu đề: et al, "„Overview of the High Efficiency Video Coding (HEVC) Standard‟, "IEEE Transactions on Circuits and Systems for Video Technology
[8] T. Wiegand et al, „Overview of the H.264/AVC video coding standard‟, IEEE Transactions on Circuits and Systems for Video Technology, vol. 13, no. 7, pp. 560-576, 2003 Sách, tạp chí
Tiêu đề: et al, " „Overview of the H.264/AVC video coding standard‟, "IEEE Transactions on Circuits and Systems for Video Technology
[9] X. Artigas, J. Ascenso, M. Dalai, S. Klomp, D. Kubasov, and M. Ouaret, “The discover codec: architecture, techniques and evaluation,” in Proceedings of Picture Coding Symposium (PCS ’07), Portugal, Nov. 2007 Sách, tạp chí
Tiêu đề: The discover codec: architecture, techniques and evaluation,” "in Proceedings of Picture Coding Symposium (PCS ’07)
[10] L. Wei, Y. Zhao, and A. Wang, “Improved side-information in distributed video coding”, in Proceedings of International Conference on Innovative Computing, Information and Control, Beijing, China, Sept. 2006 Sách, tạp chí
Tiêu đề: Improved side-information in distributed video coding”, "in Proceedings of International Conference on Innovative Computing, Information and Control
[11] J. Ascenso, C. Brites, and F. Pereira, „A flexible side information generation framework for distributed video coding‟, Multimedia Tools and Applications, vol. 48, no. 3, pp.381-409, 2010 Sách, tạp chí
Tiêu đề: Multimedia Tools and Applications
[12] A. Wyner and J. Ziv, “The rate-distortion function for source coding with side information at the decoder”, IEEE Transactions on Information Theory, vol. 22, no. 1, pp. 1-10, 1976 Sách, tạp chí
Tiêu đề: The rate-distortion function for source coding with side information at the decoder”, "IEEE Transactions on Information Theory
[13] L. Alparone, M. Barni, F. Bartolini, V. Cappellini, “Adaptively Weighted Vector- Median Filters for Motion Fields Smoothing”, IEEE ICASSP, Georgia, USA, May 1996 Sách, tạp chí
Tiêu đề: Adaptively Weighted Vector-Median Filters for Motion Fields Smoothing”, "IEEE ICASSP

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w