1. Trang chủ
  2. » Luận Văn - Báo Cáo

Kỹ thuật mã hóa video phân tán DVC và ứng dụng kỹ thuật DVC trong mạng cảm biến hình ảnh không dây

49 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 49
Dung lượng 1,44 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • 1. Lý do lựa chọn đề tài (9)
  • 2. Mục đích nghiên cứu (11)
  • 3. Đối tƣợng nghiên cứu (11)
  • 4. Phạm vi và phương pháp nghiên cứu (11)
  • 5. Cấu trúc luận văn (11)
  • CHƯƠNG I. TỔNG QUAN VỀ MÃ HÓA VIDEO DỰ ĐOÁN HEVC VÀ MÃ HÓA PHÂN TÁN DVC (13)
    • 1.1. Giới thiệu chung (13)
    • 1.2. Mã hóa video dự đoán chuẩn HEVC (14)
      • 1.2.1. Sơ đồ cấu trúc (14)
      • 1.2.2. Mã hóa trong khung (Intra coding) (17)
      • 1.2.3. Mã hóa liên khung (Inter coding) (18)
      • 1.2.4. Phép biến đổi cosin rời rạc (DCT) và phép lƣợng tử (18)
      • 1.2.5. Mã hóa entropy (19)
      • 1.2.6. Bộ lọc khối và bù thích ứng mẫu SAO (21)
    • 1.3. Mã hóa video phân tán (DVC – Distributed Video Coding) (21)
      • 1.3.1. Định lý Slepian-Wolf và định lý Wyner-Ziv (21)
      • 1.3.2. Kiến trúc mã hóa video phân tán DISCOVER (23)
    • 1.4. Kết luận chương (24)
  • CHƯƠNG II. XÂY DỰNG MÔ HÌNH MÃ HÓA VIDEO TIÊN TIẾN THẾ HỆ MỚI TRÊN NỀN CHUẨN H.265/HEVC (26)
    • 2.1. Kiến trúc mã hóa video phân tán với bộ mã hóa H.265/HEVC (26)
    • 2.2. Tạo thông tin phụ (28)
    • 2.3. Ứng dụng DVC trong mạng cảm biến hình ảnh không dây (0)
    • 2.4. Kết luận chương (35)
  • CHƯƠNG III. MÔ PHỎNG VÀ ĐÁNH GIÁ (37)
    • 3.1. Điều kiện đánh giá (37)
    • 3.2. Đánh giá chất lƣợng key frames (40)
    • 3.3. Đánh giá hiệu năng mã hóa mô hình DVC-HEVC (44)
    • 3.4. Kết luận chương (46)
  • KẾT LUẬN (12)
  • TÀI LIỆU THAM KHẢO (48)

Nội dung

Lý do lựa chọn đề tài

Video hiện chiếm khoảng 75% dữ liệu truyền tải toàn cầu và tỷ lệ này đang gia tăng đều đặn Sự phát triển của các video với độ phân giải siêu cao (UHD), dải động cao (HDR), gam màu rộng (WCG) và tốc độ khung hình cao (HFR) sẽ tạo ra nhiều thách thức mới Do đó, nhu cầu về công nghệ mã hóa video hiệu quả ngày càng trở nên cấp bách.

Kể từ khi khái niệm mã hóa được giới thiệu bởi Habibi vào năm 1974 và khung mã hóa không gian-thời gian của Forchheimer vào năm 1981, mã hóa video kết hợp (HVC) đã trở thành một phần quan trọng trong các chuẩn mã hóa hình ảnh/video phổ biến như JPEG, H.261, MPEG2, H.264/AVC và H.265/HEVC Hiệu suất mã hóa video đã cải thiện khoảng 50% mỗi 10 năm, tuy nhiên, điều này đi kèm với sự gia tăng độ phức tạp tính toán và yêu cầu bộ nhớ Hiện nay, ngành công nghiệp đang đối mặt với những thách thức lớn trong việc nâng cao hiệu quả mã hóa để đáp ứng nhu cầu kỹ thuật của các ứng dụng công nghệ hiện đại như nhận diện khuôn mặt, theo dõi đối tượng và truy xuất hình ảnh.

Với sự bùng nổ của các thiết bị video như máy quay cầm tay, mạng cảm biến video công suất thấp và điện thoại di động đa phương tiện, việc mã hóa với độ phức tạp thấp trở nên rất quan trọng để tối ưu hóa hiệu suất và tiết kiệm năng lượng cho các thiết bị di động Để đáp ứng nhu cầu truyền thông video này, mã hóa video phân tán (Distributed Video Coding - DVC) đã được phát triển dựa trên lý thuyết Slepian-Wolf và Wyner-Ziv.

DVC có thể được phát triển theo hai cách tiếp cận chính Cách tiếp cận đầu tiên, do nhóm nghiên cứu tại Đại học Stanford đề xuất, tập trung vào việc mã hóa toàn bộ khung hình Trong đó, video đầu vào được chia thành hai loại: khung hình chính (Key frame) và khung hình Wyner-Ziv (WZ frame) Các khung chính được mã hóa bằng các bộ mã hóa tiêu chuẩn với cấu hình phức tạp thấp như H.263 Intra hoặc H.264/AVC Intra, trong khi các khung WZ được mã hóa bằng các bộ mã hóa kênh.

9 mã turbo hoặc mã LDPC [5], kết hợp với ƣớc lƣợng giá trị của khung hình tại phía thu

Phương pháp mã hóa khối PRISM là cách tiếp cận thứ hai, trong đó các khối được mã hóa theo phương pháp truyền thống, kết hợp với mã hóa trong khung.

Intra coding kết hợp với mã kênh BCH giúp tối ưu hóa quá trình truyền tải dữ liệu Cả hai phương pháp này đều cho phép bộ mã hóa chuyển giao các phần phức tạp như ước lượng chuyển động từ phía phát sang phía thu, nâng cao hiệu quả truyền thông.

Bài viết mô tả sự khác biệt giữa hai phương pháp xử lý thông tin video: mã hóa video truyền thống và mã hóa video phân tán Trong phương pháp truyền thống, cả phía phát và phía thu đều thực hiện việc tạo dự đoán, dẫn đến việc phía phát phải xử lý nhiều nhiệm vụ phức tạp và gửi đi thông tin dư thừa Ngược lại, trong mã hóa video phân tán, phía thu đảm nhận việc tạo dự đoán bằng cách sử dụng thông tin phụ, trong khi phía phát chỉ cần truyền đi sự khác biệt giữa thông tin gốc và thông tin phụ Nhờ đó, thời gian mã hóa được giảm đáng kể.

Mã hóa video truyền thống và mã hóa video phân tán

Chuẩn mã hóa H.265/HEVC ra đời gần đây đã giảm khoảng 50% lượng bit so với H.264/AVC, thúc đẩy nghiên cứu cải tiến mô hình mã hóa phân tán DVC Luận văn này tập trung vào việc nghiên cứu và xây dựng một mô hình mã hóa video phân tán thế hệ mới dựa trên chuẩn H.265/HEVC và mô hình tạo thông tin phụ mới.

W W Độ phức tạp phía mã hóa cao Độ phức tạp phía giải mã thấp

W W Độ phức tạp phía mã hóa thấp Độ phức tạp phía giải mã cao

Mục đích nghiên cứu

Luận văn tập trung tìm hiểu về chuẩn mã hóa video thế hệ mới H.265/HEVC

Mô hình mã hóa video phân tán DVC được nghiên cứu nhằm cải tiến thông tin phụ cho mã hóa video thế hệ mới H.265/HEVC.

Đối tƣợng nghiên cứu

Nghiên cứu, cải thiện chất lƣợng thông tin phụ trong mô hình DVC

- Mô hình mã hóa video phân tán DVC-HEVC

- Các chuỗi video với khung hình thước nhỏ do sử dụng mã video phân tán

Phạm vi và phương pháp nghiên cứu

Luận văn này cung cấp cái nhìn tổng quan về mã hóa video, đặc biệt là chuẩn HEVC và mã hóa video phân tán DVC, cùng với mô hình DVC dựa trên kiến trúc DISCOVER Bài viết sẽ tập trung vào việc hình thành thông tin phụ từ mô hình kiến trúc DISCOVER.

- Khảo sát và nghiên cứu lý thuyết

- Phương pháp thu thập thông tin bằng cách nghiên cứu tài liệu kết hợp với kết quả thực nghiệm

- Tìm hiểu mô hình mã hóa video dự đoán chuẩn H.265/HEVC và mô hình mã hóa video phân tán DVC

- Nghiên cứu và đƣa ra cải tiến tạo thông tin phụ

- Phân tích và đánh giá.

Cấu trúc luận văn

Nội dung chính của luận văn được trình bày qua 5 chương:

Chương 1: Tổng quan về mã hóa video dự đoán HEVC và mã hóa phân tán DVC

Chương này giới thiệu về bối cảnh của nghiên cứu mã hóa video và cấu trúc tổng quan mã hóa video

Chương 2: Xây dựng mô hình mã hóa video tiên tiến thế hệ mới trên nền chuẩn H.265/HEVC

Chương này giới thiệu kiến trúc tổng quan về mã hóa video phân tán sử dụng HEVC cho mã hóa intra, đồng thời đề xuất mô hình tạo thông tin phụ mới Mã hóa DVC được ứng dụng nhằm cải thiện hiệu suất năng lượng tiêu thụ của các cảm biến.

Chương 3: Mô phỏng và đánh giá

Chương này sẽ đưa ra các kịch bản mô phỏng và đánh giá tính hiệu quả của mô hình mã hóa video phân tán thế hệ mới, DVC-HEVC

Kết luận sẽ tổng quát lại những kết quả lý thuyết và mô phỏng từ chương 1,2,3 và đƣa ra những nhận xét

TỔNG QUAN VỀ MÃ HÓA VIDEO DỰ ĐOÁN HEVC VÀ MÃ HÓA PHÂN TÁN DVC

Giới thiệu chung

Trong những năm gần đây, việc truyền tải và lưu trữ video đã trở nên phổ biến hơn nhờ vào sự giảm giá nhanh chóng của các sản phẩm như máy quay video HD, TV màn hình lớn và thiết bị lưu trữ Bên cạnh đó, sự phát triển của các bộ vi xử lý với tốc độ cao cùng với tốc độ internet được cải thiện đáng kể đã giúp việc tải phim trở nên nhanh chóng và mang lại trải nghiệm mượt mà hơn cho người dùng.

Nhu cầu trải nghiệm video đang tăng cao, với sự chuyển mình từ độ phân giải 480p và mHD 720p sang Full HD 1080p ngày càng phổ biến Sự phát triển của TV 4K trong hai năm qua đã thúc đẩy nhu cầu này mạnh mẽ hơn Điều này đặt ra áp lực lớn lên các thiết bị lưu trữ và đường truyền internet, yêu cầu một chuẩn nén video mới hiệu quả hơn để đáp ứng kịp thời.

Độ phân giải Full HD (FHD) 1920x1080 với chuẩn nén H.264 hiện nay đang dần bị thay thế bởi độ phân giải 4K x 2K (3840x2610), trong khi H.264 gặp khó khăn trong việc xử lý các tín hiệu ở độ phân giải cao Sự xuất hiện của độ phân giải Ultra HD 8K x 4K (7680x4320) càng làm cho H.264 trở nên lỗi thời, đặc biệt là trong việc quản lý dung lượng lưu trữ và xử lý hình ảnh chất lượng cao Việc xử lý hình ảnh 4K trở nên gần như không khả thi với công nghệ nén H.264 hiện tại.

H.265, hay còn gọi là HEVC (High Efficiency Video Coding), đã được Ủy ban Viễn thông Quốc tế ITU-T phê duyệt và được các nhà phát triển áp dụng vào sản phẩm thương mại Công nghệ này hứa hẹn mang lại hiệu suất nén gấp đôi so với H.264/AVC, hiện đang chiếm tới 80% nội dung video lưu trữ Nhờ khả năng nén vượt trội, H.265 giúp giảm băng thông cần thiết cho việc truyền tải video, giảm dung lượng lưu trữ và tiết kiệm chi phí cho người dùng.

13 hơn cho băng thông internet và thiết bị lưu trữ Ưu điểm vượt trội này cũng sẽ là cú hích cho thị trường thiết bị nghe nhìn 4K/UHD

Trong tương lai, người dùng sẽ có khả năng xem các đoạn video trên YouTube, Facebook và các nền tảng khác với chất lượng hình ảnh sắc nét mà không cần chờ đợi để tải về.

Vào ngày 29/2/2012, tại triển lãm Mobile World Congress, Qualcomm đã giới thiệu bộ nén mới trên tablet, cho phép chất lượng hiển thị tương đương nhưng dung lượng giảm gần một nửa.

Mã hóa video dự đoán chuẩn HEVC

Hình 1.1 mô tả sơ đồ kiến trúc mã hóa video theo chuẩn HEVC [7]

Hình 1.1: Sơ đồ cấu trúc mã hóa video theo chuẩn HEVC

Trong HEVC, mỗi ảnh đầu vào được chia thành các khối ảnh để mã hóa và truyền tải đến bộ giải mã Ảnh đầu tiên trong chuỗi video chỉ sử dụng dự đoán trong khung, trong khi các ảnh còn lại áp dụng chế độ mã hóa dự đoán liên khung theo thời gian Quá trình mã hóa này giúp tối ưu hóa hiệu suất nén dữ liệu.

Tỷ lệ Lƣợng tử Ƣớc lƣợng hình ảnh

Bù chuyển động Ƣớc lƣợng chuyển động

Tỷ lệ và biến đổi ngƣợc

Phân tích điều khiển bộ lọc

Tạo khối và lọc dữ liệu

Bộ điều khiển dữ liệu chung

Dự đoán dữ liệu Điều khiển lọc dữ liệu

Hình ảnh đƣợc giải mã và lưu trong bộ đệm

Tỷ lệ Đầu ra cho video Định dạng tiêu đề và CABAC Luồng dữ liệu nhị phân đƣợc mã hóa Đầu vào là 1 video

Khung sẽ lựa chọn dữ liệu chuyển động bao gồm ảnh tham chiếu và vector chuyển động (MV) để dự đoán các mẫu của mỗi khối ảnh Các bộ mã hóa và giải mã sử dụng kỹ thuật bù chuyển động (MC) và thông tin phụ để tạo ra tín hiệu dự đoán liên khung giống nhau Tín hiệu dư thừa trong khung và liên khung được biến đổi bởi phép biến đổi không gian tuyến tính, sau đó được định cỡ, lượng tử hóa, mã hóa entropy và truyền đi cùng với thông tin dự đoán Bộ mã hóa cũng xử lý giải mã để đảm bảo cả hai phía tạo ra dự đoán giống nhau cho ảnh tiếp theo Hệ số biến đổi lượng tử được tạo lại qua định cỡ ngược và biến đổi ngược để phục hồi tín hiệu dư thừa, sau đó được kết hợp với tín hiệu dự đoán và đưa vào bộ lọc để làm mịn ảnh Ảnh biểu diễn cuối cùng được lưu trữ trong bộ đệm ảnh giải mã để dự đoán các ảnh tiếp theo Trong các chuẩn mã hóa trước, khung ảnh được chia thành các macroblock, còn trong HEVC, ảnh được chia thành các đơn vị cây mã hóa (CTU) với kích thước CTB là 16, 32 hoặc 64, cho phép nén tốt hơn và hỗ trợ phân chia CTB thành các khối nhỏ hơn.

 Đơn vị mã hóa (CU – Coding Unit) và khối mã hóa (CB – Coding Block)

Cú pháp cây tứ phân (quadtree syntax) trong CTU cho phép chia các CB theo kích cỡ và vị trí phù hợp dựa trên đặc tính tín hiệu của vùng do CTB tạo ra, với gốc của cây tứ phân là CTU Kích cỡ của CB thường được xác định trong khoảng 8x8 < kích cỡ CB < kích cỡ CTB, trong đó đơn vị mã hóa CU sẽ bao gồm 1 CB chói.

Hai CB màu với cú pháp tương đồng, trong đó một CTB có thể chứa một hoặc nhiều CU Mỗi CU sẽ có một phân vùng liên quan đến các đơn vị dự báo (PUs) và một cây các đơn vị biến đổi (TUs).

 Đơn vị dự đoán (PU) và khối dự đoán (PB)

Quyết định mã hóa một vùng ảnh được thực hiện ở mức CU, sử dụng dự đoán liên khung hoặc dự đoán trong khung Cấu trúc phân chia PU bắt nguồn từ mức CU Tùy thuộc vào kiểu dự đoán, các thành phần chói và màu có thể được chia thành các khối dự đoán (PB) riêng biệt, với mỗi PB chứa một vector chuyển động.

 Đơn vị biến đổi (TU) và khối biến đổi (TB)

Dư thừa dự đoán mã hóa sử dụng biến đổi khối với cấu trúc cây TU có gốc ở mức CU Dư thừa CB chói có thể tương tự như khối biến đổi chói hoặc được chia thành các khối nhỏ hơn Tương tự, các khối màu cũng áp dụng quy tắc này Hàm số nguyên tương tự như hàm biến đổi cosin rời rạc (DCT) được xác định cho các khối kích thước 4x4, 8x8, 16x16 và 32x32.

Hình 1.2: Kỹ thuật phân vùng trong HEVC

1.2.2 Mã hóa trong khung (Intra coding)

Dự đoán trong khung hoạt động theo kích thước TB sử dụng các mẫu biên giải mã từ những TB lân cận để tạo ra tín hiệu dự đoán Hệ thống hỗ trợ 33 hướng khác nhau với kích thước TB từ 4x4 đến 32x32, như thể hiện trong hình 1.3 Bên cạnh đó, dự đoán mặt phẳng và dự đoán DC cũng có thể được áp dụng Đối với thành phần màu, các chế độ dự đoán ngang, dọc, mặt phẳng và DC có thể được báo hiệu rõ ràng, trong khi chế độ dự đoán thành phần màu được chỉ định giống như các chế độ dự đoán thành phần chói.

Mỗi khối (CB) được mã hóa bằng một loại mã hóa cụ thể, tùy thuộc vào loại mảng Tương tự như H.264 / MPEG-4 AVC, phương pháp mã hóa dự đoán trong khung được hỗ trợ cho tất cả các loại mảng HEVC cung cấp nhiều phương pháp mã hóa dự đoán khác nhau trong ảnh, bao gồm Intra_Angular, Intra_Planar và Intra_DC.

Một khối (CB) trong video có kích thước MxM có thể được phân chia thành hai loại phân chia vùng (PB): PART_2Nx2N, không phân chia, và PART_NxN, trong đó CB được chia thành bốn PB kích thước bằng nhau (N = M / 2) HEVC cho phép kiểu phân chia PART_NxN chỉ khi kích thước CB hiện tại bằng kích thước CU tối thiểu, đảm bảo rằng kích thước PB luôn tương đương với kích thước này Bằng cách này, HEVC có thể sử dụng bốn CB nhỏ hơn để biểu diễn các vùng tương tự khi kích thước CB lớn hơn kích thước CU tối thiểu.

CB được mã hóa bằng chế độ dự đoán trong khung, với kích thước CB không bằng với kích thước CU tối thiểu Mặc dù chế độ dự đoán trong khung ở mức PB, các quá trình dự đoán thực tại vẫn hoạt động độc lập cho từng TB.

Hình 1.3: Các chế độ và các hướng cho dự đoán hình trong khung [8]

1.2.3 Mã hóa liên khung (Inter coding)

Dự đoán ảnh liên khung trong chuẩn H.265/HEVC hỗ trợ dự đoán vectơ chuyển động với độ chính xác cao đến từng điểm ảnh (sub-pel) Giá trị tại vị trí sub-pel được nội suy từ hai bộ lọc với 7 hoặc 8 tham số cấu hình Các khối hình sử dụng trong dự đoán ảnh liên khung rất đa dạng, bao gồm cả khối đối xứng và không đối xứng, như 2N×2N, 2N×N, N×2N, N×N, 2N×nD và nL×2N.

1.2.4 Phép biến đổi cosin rời rạc (DCT) và phép lƣợng tử

Phần dư từ khung gốc được trừ đi cho khung dự đoán và sau đó được chuyển đổi sang miền tần số bằng phương pháp biến đổi Cosin rời rạc Mục đích của việc chuyển đổi này là tách biệt các thành phần tần số thấp và loại bỏ thông tin ở các thành phần tần số cao Việc này giúp giảm bớt thông tin mã hóa, trong khi việc loại bỏ thông tin tại các thành phần tần số cao thường ít ảnh hưởng đến cảm nhận của mắt người về chất lượng hình ảnh.

Hình 1.4: Giá trị điểm ảnh trong miền pixel và miền DCT tương ứng

Các thành phần tần số cao thường không dễ nhận biết bởi mắt người, và việc loại bỏ chúng được thực hiện thông qua quá trình lượng tử hóa Mục tiêu chính của lượng tử hóa là chuyển đổi tín hiệu đầu vào, cụ thể là các hệ số DCT, thành các mức lượng tử Nhờ vào quá trình này, nhiều giá trị DCT tương đương sẽ được gộp lại thành một giá trị lượng tử, từ đó giảm thiểu lượng thông tin cần mã hóa.

Hình 1.5: Mô hình phép lượng tử tuyến tính

Giá trị lượng tử được biểu diễn dưới dạng chuỗi ký tự số nguyên và cần được chuyển đổi thành chuỗi nhị phân 0 và 1 để truyền tải Mã hóa entropy sẽ được áp dụng cho từng khối ảnh và từng giá trị lượng tử với độ dài thích hợp Ví dụ, mã Huffman sử dụng mã hóa độ dài biến (VLC) cho mỗi ký hiệu dựa trên xác suất xuất hiện của chúng.

Để xây dựng một bộ từ mã có độ dài thay đổi cho 19 ký hiệu, chúng ta cần tính xác suất xuất hiện của từng ký hiệu.

Bảng 1.1: Giá trị lượng tử và xác suất tương ứng

Từ cây mã Huffman, ta có thể dễ dàng xác định được các từ mã tương ứng với từng ký hiệu theo nhƣ bảng sau:

Bảng 1.2: Mã Huffman và số lượng bit cần mã hóa tương ứng

Vectơ Mã Số bit (thực tế) Số bit (lý tưởng)

Mã hóa video phân tán (DVC – Distributed Video Coding)

1.3.1 Định lý Slepian-Wolf và định lý Wyner-Ziv

DVC, hay mã hóa video phân tán, thường được ứng dụng cho các cảm biến camera, với bộ mã hóa DVC thường đơn giản và phần phức tạp được chuyển giao cho quá trình giải mã Bộ mã hóa DVC được phát triển dựa trên lý thuyết thông tin, chủ yếu dựa vào hai định lý quan trọng là Slepian-Wolf và Wyner-Ziv.

Entropy thông tin là khái niệm mở rộng từ entropy trong nhiệt động lực học sang lý thuyết thông tin, mô tả mức độ hỗn loạn trong tín hiệu từ một sự kiện ngẫu nhiên Nó cho thấy lượng thông tin có trong tín hiệu, với thông tin là những phần không hỗn loạn của tín hiệu.

Tốc độ mã hóa, được gọi là entropy của nguồn, là tốc độ tối thiểu cần thiết để khôi phục chính xác nguồn X tại bộ giải mã Trong trường hợp có hai nguồn, việc xác định tốc độ mã hóa trở nên quan trọng để đảm bảo tính chính xác trong quá trình giải mã.

21 độc lập và Tốc độ mã hóa tối thiểu cho từng nguồn để giải mã không lỗi chính là entropy của từng nguồn và

Với hai nguồn thống kê phụ thuộc thì tính chất của Entropy đồng thời:

Tính chất của entropy có điều kiện:

- | : là entropy có điều kiện đặc trƣng cho độ bất định về nguồn tin

- | : là entropy có điều kiện đặc trƣng cho độ bất định về nguồn tin

Trong trường hợp cần mã hóa độc lập và thì tốc độ mã hóa tối thiểu sẽ là

Định lý Slepian-Wolf liên quan đến nén không tổn thất, trong đó mỗi nguồn tương quan được mã hóa độc lập và sau đó giải mã liên kết tại cùng một bộ giải mã Để áp dụng định lý này, cần thỏa mãn ba điều kiện cụ thể.

So với bộ mã hóa độc lập, bộ mã hóa Slepian-Wolf tận dụng sự tương quan giữa các nguồn, cho phép đạt được tốc độ mã hóa tương đương với mã hóa liên kết, trong khi bộ mã hóa độc lập cần tốc độ tối thiểu theo điều kiện cụ thể.

Định lý Wyner-Ziv mở rộng định lý Slepian-Wolf thông qua mã hóa có mất mát, cho phép tái tạo thông tin với sự hỗ trợ của thông tin phụ có sẵn ở phía giải mã Hệ thống này được thiết kế để đảm bảo xác suất lỗi nhỏ tùy ý trong quá trình tái tạo thông tin, giúp cải thiện hiệu quả truyền tải dữ liệu.

22 theo nhƣ biểu đồ Slepian-Wolf, tốc độ mã hóa X có thể đạt đƣợc về mặt lý thuyết | ( nhỏ tùy ý)

Hình 1.7: Biểu đồ vùng tỷ lệ tốc độ mã giữ hai nguồn X,Y

1.3.2 Kiến trúc mã hóa video phân tán DISCOVER

Kiến trúc mã hóa video phân tán DVC, được đề xuất và cải tiến bởi nhóm nghiên cứu F Pereira với tên gọi DISCOVER, là một trong những mô hình mã hóa video phân tán phổ biến và hiệu quả nhất hiện nay Hình 1.8 minh họa rõ nét kiến trúc này, cho thấy sự vượt trội so với các mô hình trước đó.

Hình 1.8 Kiến trúc mã hóa video phân tán DVC DISCOVER[2]

Trong bộ mã hóa DVC DISCOVER, video được chia thành hai chuỗi chính: khung WZ và khung chính Khung chính được mã hóa theo chuẩn H.264/AVC với cấu hình Intra coding, trong khi khung WZ sử dụng phương pháp mã hóa kênh do trưởng Đại học Stanford đề xuất.

Mặc dù bộ mã hóa DISCOVER mang lại hiệu suất mã hóa cao, nhưng các nghiên cứu gần đây về chuẩn HEVC đã chỉ ra rằng cần có những cải tiến cho mô hình mã hóa video phân tán Đặc biệt, việc kế thừa kết quả nghiên cứu từ chuẩn HEVC là rất quan trọng Trong chương 2 của luận văn, chúng tôi sẽ trình bày một mô hình mã hóa video phân tán thế hệ mới, được phát triển dựa trên nền tảng chuẩn HEVC, với một số cải tiến nhỏ trong khối tạo thông tin phụ.

Kết luận chương

Chương I đã giới thiệu và đề cập nhu cầu của mã hóa video ngày càng cao trong bối cảnh độ phân giải Full HD 1080p đã ngày một nhiều hơn Nhu cầu đó càng thể hiện mạnh mẽ hơn khi gần đây xuất hiện các TV với công nghệ hình ảnh 4K với độ phân giải siêu cao Các thiết bị lưu trữ và đường truyền internet phải chịu nhiều áp lực hơn để đáp ứng đƣợc các chuẩn phân giải mới Trong bối cảnh đó, chuẩn mã hóa video HEVC đƣợc ra đời để đáp ứng yêu cầu

Sơ đồ bộ mã hóa HEVC được trình bày trong chương này, cùng với các kỹ thuật cơ bản của mã hóa video như mã hóa trong khung, mã hóa liên khung và phép biến.

HEVC sử dụng 24 đổi cosin rời rạc, mã hóa entropy, bộ lọc khối và bù thích ứng để nâng cao hiệu quả nén Khung ảnh được chia thành các đơn vị mã hóa gọi là đơn vị cây mã hóa (CTU), bao gồm các CTB chói và CTB màu Kích thước của một CTB có thể là 16, 32 hoặc 64, cho phép sự linh hoạt trong việc chia đơn vị mã hóa, từ đó cải thiện hiệu quả nén so với các chuẩn mã hóa trước đó.

Mạng cảm biến hình ảnh không dây đang trở thành xu thế mới nhờ khả năng thu thập dữ liệu quy mô lớn trong mọi điều kiện Để tiết kiệm năng lượng, cần một chuẩn mã hóa mới giảm độ phức tạp mã hóa, chuyển phần lớn tính toán phức tạp sang giải mã Bộ mã hóa video phân tán DVC được phát triển để đáp ứng nhu cầu này, với hai định lý nền tảng: Slepian-Wolf và Wyner-Ziv Định lý Slepian-Wolf đề cập đến nén không tổn thất, trong khi định lý Wyner-Ziv mở rộng với mã hóa có mất mát, tập trung vào tái tạo thông tin tại phía giải mã Chương này cũng giới thiệu kiến trúc mã hóa video phân tán DISCOVER, trong đó chuỗi video đầu vào được chia thành khung Wyner-Ziv và khung chính, với khung chính mã hóa theo chuẩn H.264/AVC và khung WZ mã hóa theo phương pháp đề xuất bởi Đại học Stanford.

XÂY DỰNG MÔ HÌNH MÃ HÓA VIDEO TIÊN TIẾN THẾ HỆ MỚI TRÊN NỀN CHUẨN H.265/HEVC

Kiến trúc mã hóa video phân tán với bộ mã hóa H.265/HEVC

Hình 2.1 mô tả kiến trúc mã hóa video phân tán thế hệ mới, đƣợc xây dựng trên nền tảng bộ mã hóa chuẩn HEVC (DVC-HEVC)

Hình 2.1: Cấu trúc mã hóa DVC-HEVC

Kiến trúc DVC-HEVC, tương tự như các kiến trúc mã hóa video thế hệ cũ, phân tách video đầu vào thành hai nhóm: khung chính (Key frames) và khung WZ (WZ frames) Trong đó, các khung chính được mã hóa theo chuẩn HEVC với cấu hình Intra.

WZ được mã hóa phân tán theo các bước sau:

Chuỗi video được phân loại thành các khung WZ và khung chính, trong đó số lượng khung WZ nằm giữa hai khung chính phụ thuộc vào kích thước của nhóm ảnh (GOPs).

Biến đổi cosin rời rạc Lƣợng tử hóa

Biến đổi cosin rời rạc ngƣợc

Biến đổi cosin rời rạc CNM

Tạo thông tin phụ trợ

Bộ giải mã H265/HEVC intra

Bộ mã hóa H265/HEVC intra

Phía mã hóa Phía giải mã

Khung WZ đã đƣợc giải mã

Key frame Khung chính đã đƣợc giải mã

- Biến đổi không gian: một biến đổi dựa trên khối, điển hình là DCT, đƣợc áp dụng cho từng khung WZ

- Lƣợng tử hóa: Mỗi dải DCT đƣợc lƣợng tử hóa đồng nhất với một số mức phụ thuộc vào chất lƣợng mục tiêu

Mã hóa LDPC (hoặc Turbo) bắt đầu bằng việc mã hóa mỗi băng DCT từ mặt phẳng bit quan trọng nhất (MSB) Thông tin chẵn lẻ được tạo ra cho từng mặt phẳng bit sẽ được lưu trữ trong bộ đệm và được gửi đến bộ giải mã khi có yêu cầu.

Bộ giải mã tạo thông tin phụ từ các khung chính đã được giải mã, với thông tin phụ cho mỗi khung WZ được ước tính từ phiên bản nhiễu của khung gốc Chất lượng thông tin phụ càng cao, số bit chẵn lẻ cần thiết sẽ càng giảm.

Mô hình nhiễu tương quan (CNM) được áp dụng để sửa "lỗi" trong khung thông tin phụ bằng cách ước tính nhiễu giữa khung thông tin phụ và khung WZ Do không có khung WZ tại bộ giải mã, các khung chính sẽ được giải mã trước và sau, kết hợp với vectơ chuyển động trong quá trình tạo thông tin phụ Mô hình phân phối Laplacian sẽ được sử dụng để ước tính nhiễu này.

Bộ giải mã LDPC (Low-Density Parity-Check) hoặc Turbo hoạt động bằng cách nhận các khối mã hóa liên tiếp của các bit chẵn lẻ, dựa trên các yêu cầu trong kênh phản hồi Số lượng yêu cầu bit chẵn lẻ được xác định theo mô hình ước lượng nhiễu, giúp tối ưu hóa quá trình giải mã.

Sau khi giải mã LDPC, các mặt phẳng bit liên kết với mỗi dải DCT được nhóm lại để tạo thành các ký hiệu lượng tử đã được giải mã Từ những ký hiệu này, tất cả các hệ số DCT có thể được xây dựng lại Sau quá trình giải mã kênh, các mặt phẳng bit liên quan đến từng DCT chuẩn cũng được nhóm lại nhằm tạo ra ký hiệu lượng tử Ký hiệu lượng tử đã giải mã sau đó được kết hợp với thông tin phụ có sẵn tại bộ giải mã để phục hồi hệ số DCT.

27 đƣợc xây dựng lại, một biến đổi cosine rời rạc ngƣợc (IDCT) đƣợc thực hiện và thu đƣợc khung WZ đƣợc giải mã.

Tạo thông tin phụ

Để nâng cao chất lượng thông tin phụ (SI), nhiều tài liệu đã được giới thiệu, chủ yếu tập trung vào phương pháp nội suy Quy trình tạo thông tin phụ ban đầu gồm bốn bước: ước lượng chuyển động trước, ước lượng chuyển động hai chiều, lọc trung bình vectơ có trọng số và bù chuyển động khối không chồng chéo Tuy nhiên, do thiếu khung gốc tại bộ giải mã, các vectơ chuyển động được tạo ra thường không chính xác, dẫn đến thông tin phụ kém chất lượng và hiệu quả mã hóa video thấp Để khắc phục vấn đề này, một phương pháp sàng lọc bù chuyển động đã được đề xuất, nhằm xác định và tinh chỉnh các vectơ chuyển động không chính xác bằng cách lựa chọn giữa các chế độ bù khác nhau.

Thông tin phụ cho mã hóa video phân tán có thể được tạo ra bằng các phương pháp như ngoại suy khung và nội suy khung Ngoại suy khung ước tính khung tiếp theo dựa trên các khung tham chiếu trước đó, trong khi nội suy khung (MCTI - Nội suy tạm thời bù chuyển động) ước tính khung dựa trên các khung lân cận, sử dụng cả tham chiếu trong quá khứ và tương lai Việc sử dụng nội suy khung chính xác hơn giúp giảm lỗi và yêu cầu ít bit chẵn lẻ hơn từ bộ mã hóa, từ đó giảm số lượng bit cần truyền Phía giải mã sẽ cố gắng dự đoán khung WZ dựa trên các khung chính.

Kỹ thuật nội suy khung đơn giản nhất là tạo ra Y từ khung chính, sử dụng khung liền kề trước đó hoặc thực hiện phép nội suy giữa các khung chính k-i và k Tuy nhiên, khi áp dụng các kỹ thuật này để tạo thông tin phụ trong chuỗi video chuyển động trung bình hoặc cao, Y chỉ là ước lượng thô của X (khung WZ) do độ tương quan giữa hai khung.

Khi xử lý các khung liền kề theo thời gian, cần yêu cầu nhiều bit chẵn lẻ hơn từ mã hóa để so sánh và tìm Y, giúp ước lượng gần hơn với X, từ đó tăng tốc độ bit và PSNR Để nội suy khung, việc tìm ước lượng của khung hiện tại theo hướng ước lượng chuyển động thực là cần thiết, nhằm thực hiện bù chuyển động giữa các khung liền kề Nội suy bù chuyển động dựa trên các khối có độ phức tạp thấp và tương thích với hầu hết các chuẩn nén video.

Hình 2.2: Quá trình nội suy khung

 Ước lượng chuyển động trước

Cả hai khung chính được lọc thông thấp để nâng cao độ tin cậy của các vectơ chuyển động, giúp ước lượng gần hơn với trường chuyển động thực Thuật toán so khối được sử dụng để ước lượng chuyển động giữa hai khung chính, với các tham số như kích thước cửa sổ tìm kiếm, phạm vi tìm kiếm và kích thước bước Kích thước bước, khoảng cách giữa các pixel trong khung chính trước, giúp giảm độ phức tạp tính toán Tuy nhiên, sơ đồ ước lượng chuyển động dựa trên khối cố định không thể nắm bắt toàn bộ khía cạnh của trường chuyển động, dẫn đến sự xuất hiện của các vùng chồng chéo khi nội suy khung, do các vectơ chuyển động không nhất thiết cắt khung nội suy ở trung tâm của mỗi khối không bị chồng chéo.

Lọc thông thấp Ƣớc lƣợng chuyển động trước Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều

Bù chuyển động hai chiều

Các vectơ chuyển động được sử dụng làm ứng viên cho mỗi khối không chồng chéo trong khung nội suy Vectơ nào cắt khung nội suy gần trung tâm khối hơn sẽ được chọn Mỗi khối trong hình ảnh nội suy sẽ có một vectơ chuyển động, cho phép thực hiện bù chuyển động hai chiều để thu được khung nội suy hoặc xử lý thêm trong các khối tiếp theo.

 Ước lượng chuyển động hai chiều với quỹ đạo tuyến tính

Khối ước lượng chuyển động hai chiều tinh chỉnh các vectơ chuyển động thu được từ bước trước bằng cách chọn một quỹ đạo tuyến tính giữa các khung chính kế tiếp và trước đó, đi qua điểm trung tâm của các khối trong khung được nội suy Phạm vi tìm kiếm được giới hạn trong một chuyển vị nhỏ xung quanh vị trí khối ban đầu, với các vectơ chuyển động giữa khung nội suy và các khung chính trước đó và kế tiếp có tính đối xứng Cụ thể, tọa độ của khối trong khung chính trước đó và kế tiếp được tính toán dựa trên vectơ chuyển động thu được, chia cho một nửa, vì khung nội suy có khoảng cách tương đương với cả hai khung chính.

Hình 2.3: Lựa chọn vectơ chuyển động

Hình 2.4: Ước lượng chuyển động hai chiều

MV ứng viên trong một phạm vi tìm kiếm

 Làm mịn chuyển động không gian

Sau khi ước lượng chuyển động hai chiều, có thể xuất hiện các vectơ chuyển động không chính xác so với trường chuyển động thực Để cải thiện điều này, thuật toán làm mịn chuyển động không gian có thể được áp dụng Lọc trung bình vectơ có trọng số được sử dụng để loại bỏ nhiễu trong ảnh, xem xét tất cả các thành phần nhiễu Bộ lọc này tìm kiếm các vectơ chuyển động ứng viên tại mỗi khối và các khối lân cận, nhằm duy trì sự kết hợp không gian của các vectơ trong trường chuyển động.

Bộ lọc này được điều chỉnh thông qua một tập hợp trọng số, giúp làm mịn tùy thuộc vào lỗi dự đoán MSE của khối cho từng vectơ ứng viên Bộ lọc vectơ trung bình có trọng số được định nghĩa như trong tài liệu [13].

- x 1 ,….,xN là các vectơ chuyển động của khối hiện tại trong khung đƣợc nội suy trước đó và các khối lân cận gần nhất

- w 1 ,….w N tương ứng với một tập các trọng số biến đổi thích ứng

- x wvmf đại diện cho đầu ra vectơ chuyển động của bộ lọc

Việc lựa chọn trọng số đƣợc thực hiện theo lỗi dự đoán đƣợc xác định nhƣ sau: c j j

- x c đại diện cho vectơ ứng viên của khối đƣợc làm mịn B

MSE biểu thị sự so khớp giữa khối B hiện tại trong khung chính kế tiếp và khối trong khung chính trước đó được bù chuyển động bằng vectơ x c và x j

Sau khi xác định được trường vectơ chuyển động cuối cùng, khung nội suy có thể được tạo ra bằng cách áp dụng bù chuyển động hai chiều, theo các tiêu chuẩn mã hóa video hiện hành.

 Cải tiến quá trình nội suy

Hình 2.5: Quá trình nội suy khung kết hợp ước lượng chuyển động trước và sau

Sơ đồ trên trình bày một phương pháp mở rộng mới cho quá trình nội suy khung, trong đó kết hợp ước lượng chuyển động sau để cải thiện chất lượng khung nội suy Khác với phương pháp trước đây chỉ sử dụng ước lượng chuyển động từ khối trước, phương pháp mới này ước lượng vectơ chuyển động dựa trên key frame k-i, thay vì chỉ từ key frame k, nhằm tạo ra khung nội suy tốt hơn.

Quá trình nội suy khung kết hợp ước lượng chuyển động trước và sau sẽ thực hiện các bước tương tự như đã mô tả Hai kết quả khung nội suy sau đó sẽ được kết hợp bằng cách tính trung bình cộng để tạo ra khung nội suy cuối cùng.

Lọc thông thấp Ƣớc lƣợng chuyển động trước Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều

Bù chuyển động hai chiều

Lọc thông thấp Ƣớc lƣợng chuyển động sau

Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều

Bù chuyển động hai chiều

2.3 Ứng dụng DVC trong việc tiết kiệm năng lƣợng cho cảm biến

Mạng cảm biến không dây bao gồm nhiều nút được triển khai gần đối tượng cần khảo sát, cho phép thu thập dữ liệu một cách linh hoạt và ngẫu nhiên, đặc biệt trong các khu vực khó tiếp cận hoặc nguy hiểm Đặc điểm nổi bật của mạng này là khả năng tự tổ chức và hợp tác giữa các cảm biến, giúp tối ưu hóa quy trình truyền thông Việc sử dụng truyền thông đa liên kết giữa các cảm biến gần nhau không chỉ giảm thiểu công suất tiêu thụ mà còn nâng cao hiệu quả truyền tín hiệu so với truyền thông đơn liên kết và khoảng cách xa.

Mạng cảm biến hình ảnh không dây được sử dụng để giám sát từ xa các khu vực địa lý, tuy nhiên việc truyền và nhận dữ liệu hình ảnh và video cần được mã hóa để tiết kiệm năng lượng Mã hóa video là một quá trình phức tạp có thể dẫn đến hao hụt năng lượng lớn, đặc biệt ở các cảm biến có dung lượng pin hạn chế Do đó, việc đánh giá các tùy chọn mã hóa video khác nhau là cần thiết để thiết kế và lựa chọn phương pháp nén tiết kiệm năng lượng nhất cho mạng cảm biến hình ảnh không dây.

Mô hình mã hóa video dự đoán và phân tán đã được thực nghiệm và đánh giá hiệu quả năng lượng để xác định mô hình tối ưu cho thiết bị cảm biến thực tế Kết quả cho thấy mã hóa video dự đoán, mặc dù có hiệu quả nén cao hơn, nhưng tiêu tốn năng lượng nhiều hơn so với mã hóa trong khung Do đó, nén hình ảnh dựa trên mã hóa trong khung được ưu tiên để nâng cao hiệu quả năng lượng Đối với mã hóa video phân tán, bộ mã hóa Wyner-Ziv cho thấy hiệu suất năng lượng vượt trội hơn so với bộ mã hóa PRISM.

Kết luận chương

Chương II mô tả kiến trúc mã hóa video phân tán thế hệ mới, được xây dựng trên nền tảng bộ mã hóa chuẩn HEVC Tương tự như các kiến trúc mã hóa video thế hệ cũ, với kiến trúc DVC-HEVC, video đầu vào đƣợc phân tách thành 2 nhóm bao gồm khung chính và khung WZ Trong khi các khung chính đƣợc mã hóa với chuẩn

HEVC cấu hình Intra, các khung WZ được mã hóa phân tán gồm các bước phân loại khung, biến đổi không gian, lƣợng tử hóa và mã hóa LDPC

Tạo thông tin phụ là kỹ thuật quan trọng trong mã hóa video phân tán, giúp giảm lỗi và yêu cầu ít bit chẵn lẻ hơn từ bộ mã hóa, từ đó giảm lượng bit cần truyền Chương II mô tả quy trình tạo thông tin phụ thông qua kỹ thuật nội suy khung, bao gồm các bước ước lượng chuyển động trước, ước lượng chuyển động hai chiều, làm mịn chuyển động và bù chuyển động hai chiều Một cải tiến nhỏ trong quá trình này là kết hợp bộ ước lượng chuyển động sau với ước lượng chuyển động trước, giúp tạo ra khung nội suy cuối cùng bằng cách lấy trung bình cộng của hai khung nội suy, từ đó nâng cao độ chính xác của khung nội suy.

Chương II cũng đã đề cập đến một trong những ứng dụng của mạng cảm biến hình ảnh không dây trong việc giúp các cảm biến có thể tiết kiệm năng lƣợng hơn nhờ giảm thiểu mức độ phức tạp tại phía mã hóa Bằng việc đƣa ra các thông số thực nghiệm về tiêu thụ năng lƣợng đối với mã hóa liên khung và mã hóa trong khung cũng nhƣ của mô hình mã hóa phân tán và mã hóa dự đoán, chúng ta có thể thấy đƣợc lợi ích của mô hình mã hóa phân tán nói chung và mô hình mã hóa video phân tán nói riêng trong việc giảm thiểu mức độ tiêu thụ năng lƣợng, một trong những yêu cầu bắt buộc đối với các mạng cảm biến

MÔ PHỎNG VÀ ĐÁNH GIÁ

Điều kiện đánh giá

Để đánh giá hiệu quả của thông tin phụ SI do các kỹ thuật mã hóa Intra tạo ra cho khung chính, chúng tôi đã thực hiện nhiều thí nghiệm với các chuỗi video sử dụng các chuẩn mã hóa Intra khác nhau, bao gồm H.264/AVC và H.265/HEVC.

Bài viết khảo sát hiệu năng của các bộ mã hóa khung chính và mã hóa khung WZ thông qua 04 chuỗi video chuẩn QCIF, bao gồm Soccer, Foreman, Coastguard và Hall Monitor Đánh giá hiệu năng mã hóa được thực hiện bằng cách sử dụng PSNR, một hàm đo chất lượng video sau khi giải mã các khung chính và khung WZ, tương ứng với tốc độ Bitrate của từng khung video.

Kích thước GOP được cấu hình là 2, bao gồm 1 khung chính và 1 khung WZ, là cấu hình phổ biến trong mã hóa DVC Chất lượng mã hóa của khung chính dựa vào kỹ thuật mã hóa Intra ảnh hưởng lớn đến chất lượng và độ tin cậy của thông tin phụ SI, từ đó tác động trực tiếp đến hiệu năng tổng thể của bộ mã hóa DVC.

Với các mô hình mã hóa video phân tán, ứng dụng chủ yếu trong hệ thống cảm biến không dây dẫn đến kích thước khung hình nhỏ Các chuỗi video được chọn gồm 4 chuỗi phổ biến trong việc đánh giá hiệu năng mã hóa DVC, bao gồm: Foreman, Hall monitor, Coastguard và Soccer Những chuỗi video này có thể được tải về từ trang web [http://trace.eas.asu.edu/yuv/].

Các thông số như kích thước, tốc độ khung hình và số khung hình được trình bày chi tiết trong bảng 3.1, trong khi hình ảnh đầu tiên của các chuỗi video được thể hiện ở hình 3.1.

Bảng 3.1: Bảng mô tả tóm tắt các thông số sử dụng đánh giá

Tên chuỗi video Foreman Hall Monitor Coastguard Soccer

Tốc độ khung hình 15 Hz

Kích cỡ nhóm ảnh 2 (Key – WZ – Key)

Tham số lƣợng tử QM1, QM3, QM5, QM7

Hình 3.1: Mô tả khung hình đầu tiên của 4 chuỗi video

Foreman Coastguard Hall monitor Soccer

Bộ mã hóa DVC sử dụng bảng giá trị ma trận lượng tử (QM) như đã đề cập trong bài báo [9], trong khi các giá trị lượng tử tương ứng được áp dụng trong bộ mã hóa chuẩn HEVC theo bảng 3.2.

Bảng 3.2: Giá trị lượng tử cho khung chính tại GOP=2, QCIF 15Hz

Sequences QM1 QM3 QM5 QM7

 Các bộ mã hóa tham chiếu:

- H.264/AVC Intra: H.264/AVC Intra là mô hình mã hóa theo chuẩn H.264/AVC

Mô hình H.264/AVC Intra có độ phức tạp thấp, cho phép khai thác tính tương quan không gian trong các khung hình video, dẫn đến hiệu năng mã hóa thấp hơn so với mô hình H.264/AVC Inter, vốn khai thác tính tương quan thời gian Tuy nhiên, nhờ vào ưu điểm này, H.264/AVC Intra thường được sử dụng trong các mạng cảm biến không dây và là mô hình phổ biến trong việc đánh giá hiệu năng mã hóa DVC trước đây.

HEVC Intra là công nghệ mã hóa video tiên tiến nhất hiện nay, cho phép mã hóa hiệu quả các video với thời gian mã hóa ngắn.

Mô hình mã hóa tham chiếu chính được nghiên cứu và đề xuất trong luận văn này là mô hình mã hóa HEVC, với trọng tâm là cấu hình mã hóa toàn Intra, như đã được trình bày chi tiết trong Chương II.

- DVC-AVC: Đây là bộ mã hóa video phân tán thế hệ cũ, sử dụng chuẩn

H.264/AVC Intra được sử dụng để mã hóa và giải mã các key frames, là một tham chiếu quan trọng để đánh giá hiệu suất mã hóa cho mô hình mã hóa video được đề xuất Bộ mã hóa video DVC-AVC, được khai thác trong luận văn này, dựa trên nền tảng nghiên cứu gần đây.

DVC-HEVC là bộ mã hóa video phân tán thế hệ mới, sử dụng chuẩn HEVC để mã hóa và giải mã các khung chính Để nâng cao hiệu năng mã hóa, chúng tôi đề xuất phương pháp tạo khung hình phụ, kết hợp hiệu quả các mô hình ước lượng chuyển động từ cả hai chiều, như đã trình bày trong chương II.

Đánh giá chất lƣợng key frames

Mã hóa và giải mã khung chính đóng vai trò quan trọng trong quá trình mã hóa các khung hình WZ Chương này sẽ đánh giá chất lượng giải mã khung chính dựa trên hai chuẩn mã hóa video phổ biến, H.264/AVC và HEVC.

Phương pháp đánh giá video bao gồm đánh giá chủ quan và khách quan Đánh giá chủ quan dựa vào cảm nhận của con người khi so sánh các khung hình theo chuẩn H.264/AVC và HEVC Trong khi đó, đánh giá khách quan sử dụng đồ thị để phân tích số lượng bit thông tin cần mã hóa và chất lượng sau giải mã, được đo bằng ma trận PSNR (Peak Signal to Noise Ratio).

- MSE: Mean Squared Error là giá trị trung bình bình phương lỗi (sự khác biệt) giữa tín hiệu trước và sau giải mã

Hình 3.2, 3.3, 3.4, 3.5 mô tả đánh giá khách quan trong khi hình 3.6 và hình 3.7 mô tả đánh giá chủ quan cho 4 chuỗi video đƣợc lựa chọn trong luận văn này

Hình 3.2: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC

Hình 3.3: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC

Hình 3.4: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC

Hình 3.5: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC

Hình 3.6: Đánh giá chất lượng khung hình giữa H.264/AVC và H.265/HEVC (Video

Hình 3.7: Đánh giá chất lượng khung hình giữa H.264/AVC và H.265/HEVC (Video coastguard)

Từ kết quả thu đƣợc trên các hình, một số kết luận có thể đƣợc rút ra nhƣ sau:

Mô hình mã hóa H.265/HEVC mang lại hiệu suất mã hóa vượt trội so với H.264/AVC, thể hiện rõ qua cả các đánh giá chủ quan và khách quan.

 Với đánh giá chủ quan, bằng mắt thường có thể dễ dàng thấy sự khác biệt về chất lƣợng giữa hai mô hình nhƣ minh họa ở hình 3.6 và hình 3.7

Đánh giá hiệu năng mã hóa mô hình DVC-HEVC

Để đánh giá tổng quan hiệu năng mã hóa của mô hình DVC-HEVC, các kết quả về lượng bit mã hóa thông tin và chất lượng video sau khi giải mã được mô tả và đánh giá trong hình 3.8 và hình 3.9.

Hình 3.8: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC

Hình 3.9: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC

Hình 3.10: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC

Hình 3.11: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC

Ngày đăng: 11/06/2021, 07:53

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] A. Habibi, “Hybrid coding of pictorial data”, IEEE Transactions on Communications, vol. 22, no. 5, pp. 614–624, May 1974 Sách, tạp chí
Tiêu đề: Hybrid coding of pictorial data”, "IEEE Transactions on Communications
[2] C. Brites and F. Pereira, “Distributed video coding: Bringing new applications to life”, 5 th Conference on Telecommunications – ConfTele, Apr. 2005 Sách, tạp chí
Tiêu đề: Distributed video coding: Bringing new applications to life”, "5"th" Conference on Telecommunications – ConfTele
[3] D. Slepian and J. Wolf, “Noiseless coding of correlated information sources”, IEEE Transactions on Information Theory, vol. 19, no. 4, pp. 471-480, 1973 Sách, tạp chí
Tiêu đề: Noiseless coding of correlated information sources”, "IEEE Transactions on Information Theory
[4] B. Girod, A. Aaron, S. Rane, and D. Rebollo-Monedero, “Distributed Video Coding,” Proceedings of the IEEE, vol. 93, no. 1, pp. 71–83, Jan. 2005 Sách, tạp chí
Tiêu đề: Distributed Video Coding,” "Proceedings of the IEEE
[5] A. D. Liveris, “Compression of binary sources with side information at the decoder using LDPC codes,” IEEE Communication Letters, vol. 6, no. 10, October 2002 Sách, tạp chí
Tiêu đề: Compression of binary sources with side information at the decoder using LDPC codes,” "IEEE Communication Letters
[6] R. Puriand and K. Ramchandran, “PRISM: a new robust video coding architecture based on distributed compression principles”, Proceedings of the 40th Allerton Conference Communication, Control and Computing, 2002 Sách, tạp chí
Tiêu đề: PRISM: a new robust video coding architecture based on distributed compression principles”, "Proceedings of the 40th Allerton Conference Communication, Control and Computing
[7] G.J. Sullivan et al, „Overview of the High Efficiency Video Coding (HEVC) Standard‟, IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, no. 12, pp.1649-1668, 2012 Sách, tạp chí
Tiêu đề: et al, "„Overview of the High Efficiency Video Coding (HEVC) Standard‟, "IEEE Transactions on Circuits and Systems for Video Technology
[8] T. Wiegand et al, „Overview of the H.264/AVC video coding standard‟, IEEE Transactions on Circuits and Systems for Video Technology, vol. 13, no. 7, pp. 560-576, 2003 Sách, tạp chí
Tiêu đề: et al, " „Overview of the H.264/AVC video coding standard‟, "IEEE Transactions on Circuits and Systems for Video Technology
[9] X. Artigas, J. Ascenso, M. Dalai, S. Klomp, D. Kubasov, and M. Ouaret, “The discover codec: architecture, techniques and evaluation,” in Proceedings of Picture Coding Symposium (PCS ’07), Portugal, Nov. 2007 Sách, tạp chí
Tiêu đề: The discover codec: architecture, techniques and evaluation,” "in Proceedings of Picture Coding Symposium (PCS ’07)
[10] L. Wei, Y. Zhao, and A. Wang, “Improved side-information in distributed video coding”, in Proceedings of International Conference on Innovative Computing, Information and Control, Beijing, China, Sept. 2006 Sách, tạp chí
Tiêu đề: Improved side-information in distributed video coding”, "in Proceedings of International Conference on Innovative Computing, Information and Control
[11] J. Ascenso, C. Brites, and F. Pereira, „A flexible side information generation framework for distributed video coding‟, Multimedia Tools and Applications, vol. 48, no. 3, pp.381-409, 2010 Sách, tạp chí
Tiêu đề: Multimedia Tools and Applications
[12] A. Wyner and J. Ziv, “The rate-distortion function for source coding with side information at the decoder”, IEEE Transactions on Information Theory, vol. 22, no. 1, pp. 1-10, 1976 Sách, tạp chí
Tiêu đề: The rate-distortion function for source coding with side information at the decoder”, "IEEE Transactions on Information Theory
[13] L. Alparone, M. Barni, F. Bartolini, V. Cappellini, “Adaptively Weighted Vector- Median Filters for Motion Fields Smoothing”, IEEE ICASSP, Georgia, USA, May 1996 Sách, tạp chí
Tiêu đề: Adaptively Weighted Vector-Median Filters for Motion Fields Smoothing”, "IEEE ICASSP

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w