1. Trang chủ
  2. » Công Nghệ Thông Tin

Đồ án tổng quan về chuẩn nén MPEG 4 h 264 AVC và khả năng ứng dụng trong thực tiễn

111 24 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 111
Dung lượng 3,31 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • LỜI GIỚI THIỆU

  • CÁC THUẬT NGỮ TIẾNG ANH

  • LỜI MỞ ĐẦU

  • CHƯƠNG I. CƠ SỞ VỀ NÉN TÍN HIỆU VIDEO

    • I.1 SỰ CẦN THIẾT CỦA NÉN TÍN HIỆU

    • I.2 QUÁ TRÌNH SỐ HÓA TÍN HIỆU

      • I.2.1 LẤY MẪU

      • I.2.2 LƯỢNG TỬ HÓA.

      • I.2.3 MÃ HÓA

    • I.3 TỐC ĐỘ BIT VÀ THÔNG LƯỢNG KÊNH TRUYỀN TÍN HIỆU SỐ

      • I.3.1 TỐC ĐỘ BÍT

      • I.3.2 THÔNG LƯỢNG KÊNH TRUYỀN

    • I.4 QUÁ TRÌNH BIẾN ĐỔI TÍN HIỆU MÀU

    • I.5 CÁC TIÊU CHUẨN LẤY MẪU TÍN HIỆU VIDEO SỐ

    • I.6 MÔ HÌNH NÉN TÍN HIỆU VIDEO

      • I.6.1 NÉN TÍN HIỆU VIDEO

      • I.6.2 LƯỢNG TIN TRUNG BÌNH (ENTROPY)

  • CHƯƠNG II. CÁC KỸ THUẬT NÉN VIDEO

    • II.1 PHÂN LOẠI CÁC KỸ THUẬT NÉN

    • II.2 QUÁ TRÌNH BIẾN ĐỔI

      • II.2.1 ĐIỀU XUNG MÃ VI SAI DPCM

      • II.2.2 MÃ HÓA BIẾN ĐỔI

        • II.2.2.1 Biến đổi cosin rời rạc DCT

        • II.2.2.2 Biến đổi Hadamard

    • II.3 QUÁ TRÌNH LƯỢNG TỬ

      • II.3.1 LƯỢNG TỬ HÓA VÔ HƯỚNG

      • II.3.2 LƯỢNG TỬ HÓA VECTOR

    • II.4 QUÁ TRÌNH MÃ HÓA

      • II.4.1 MÃ HÓA ĐỘ DÀI THAY ĐỔI

        • II.4.1.1 Mã hóa Huffman

        • II.4.1.2 Mã hoá mức dọc chiều dài RLC

      • II.4.2 MÃ HÓA SỐ HỌC

    • II.5 TIÊU CHUẨN ĐÁNH GIÁ CHẤT LƯỢNG ẢNH NÉN

  • CHƯƠNG III. CÁC CHUẨN NÉN THUỘC HỌ MPEG TRƯỚC MPEG-4 H.264/AVC

    • III.1 GIỚI THIỆU VỀ LỊCH SỬ PHÁT TRIỂN CỦA KỸ THUẬT MPEG

    • III.2 CÁC TIÊU CHUẨN NÉN TRƯỚC MPEG-4 H.264/AVC

      • III.2.1 TIÊU CHUẨN MPEG-1

        • III.2.1.1 Các đặc điểm của tiêu chuẩn MPEG-1

        • III.2.1.2 Cấu trúc dòng bit của MPEG-1

      • III.2.2 TIÊU CHUẨN MPEG-2

        • III.2.2.1 Các đặc điểm của tiêu chuẩn MPEG-2

        • III.2.2.2 Sự khác nhau chính giữa MPEG-1 và MPEG-2

      • III.2.3 TIÊU CHUẨN MPEG-4

      • III.2.4 SO SÁNH ĐẶC ĐIỂM NỔI BẬT CỦA CÁC CHUẨN NÉN

  • CHƯƠNG IV. CHUẨN NÉN MPEG-4 H.264/AVC

    • IV.1 TỔNG QUAN VỀ CHUẨN NÉN MPEG-4 H.264/AVC

      • IV.1.1 LỊCH SỬ PHÁT TRIỂN CỦA MPEG-4 H.264/AVC

      • IV.1.2 CÁC PROFLIES VÀ LEVELS TRONG H.264/AVC

        • IV.1.2.1 CÁC PROFILES

        • IV.1.2.2 CÁC LEVELS

    • IV.2 NHỮNG ĐẶC TÍNH NỔI BẬT CỦA CHUẨN NÉN H.264/AVC

    • IV.3 KỸ THUẬT NÉN VIDEO H.264/AVC

      • IV.3.1 GIẢI THÍCH NGUYÊN LÝ HOẠT ĐỘNG CƠ BẢN

        • IV.3.1.1 Sơ đồ mã hóa

        • IV.3.1.2 Sơ đồ giải mã

      • IV.3.2 KHỐI NÉN THỜI GIAN

        • IV.3.2.1 Dự đoán một chiều (mã hóa ảnh Prediction).

        • IV.3.2.2 Dự đoán hai chiều( mã hóa ảnh Bidiriectional Prediction)

          • IV.3.2.2.a Sơ đồ nguyên lý nén ảnh B.

          • IV.3.2.2.b Bù chuyển động trong các slice B

        • IV.3.2.3 Dự đoán liên ảnh (Inter-Frame)

        • IV.3.2.4 Mã hóa ảnh SP (switching P) và SI (switching I).

      • IV.3.3 KHỐI NÉN KHÔNG GIAN

        • IV.3.3.1 Chia ảnh thành các MacroBlock

        • IV.3.3.2 Dự đoán trong ảnh (Intra-frame)

          • IV.3.3.2.a INTRA LUMA 4 x 4

          • IV.3.3.2.b INTRA LUMA 16 x 16

          • IV.3.3.2.c INTRA CHROMA 8x8

          • IV.3.3.2.d INTRA-PCM

        • IV.3.3.3 Dự đoán trọng số:

        • IV.3.3.4 Kỹ thuật tiên đoán bù chuyển động và ước lượng chuyển động

          • IV.3.3.4.a Bù chuyển động thích nghi khối

          • IV.3.3.4.b Bù chuyển động một phần tư

            • IV.3.3.4.b.1 Mẫu nội suy thành phần luma.

            • IV.3.3.4.b.2 Mẫu nội suy thành phần chroma.

          • IV.3.3.4.c Bù chuyển động cho các VOP hình chữ nhật và bất kỳ

          • IV.3.3.4.d Bù chuyển động toàn phần GMC

          • IV.3.3.4.e Bù chuyển động cho các MB đường biên

        • IV.3.3.5 Phép biến đổi nguyên ICT (Integer Discrete Cosin Transform)

          • IV.3.3.5.a Biến đổi Hadamard cho các hệ số DC luma của khối 4x4

          • IV.3.3.5.b Biến đổi Hadamard cho hệ số DC chroma của khối 2x2.

        • IV.3.3.6 Quá trình lượng tử

        • IV.3.3.7 Quá trình giải lượng tử:

        • IV.3.3.8 Quét Zig-Zag

        • IV.3.3.9 Mã hóa xen kẽ.

        • IV.3.3.10 Sắp xếp thứ tự Slice.

      • IV.3.4 MÃ HÓA ENTROPY

        • IV.3.4.1 Mã hóa Entropy Exp-Golomb.

        • IV.3.4.2 Mã hóa độ dài biến đổi thích nghi nội dung CAVLC

        • IV.3.4.3 Mã hóa số học nhị phân thích nghi nội dung CABAC

      • IV.3.5 BỘ LỌC TÁCH KHỐI TRONG VÒNG

        • IV.3.5.1 Nguyên tắc của lọc tách khối

        • IV.3.5.2 Quá trình lọc khối

      • IV.3.6 CẤU TRÚC VÀ CÚ PHÁP CHUẨN H.264/AVC.

        • IV.3.6.1 Lớp trừu tượng mạng NAL

        • IV.3.6.2 Lớp mã hóa video VCL (Video Coding Layer)

        • IV.3.6.3 Kỹ thuật FMO và Data Partitioned Slices

        • IV.3.6.4 Kỹ thuật Arbitrary Slice Ordering

        • IV.3.6.5 Cấu trúc dòng bit H.264/AVC

  • CHƯƠNG V. MỘT SỐ ỨNG DỤNG CHUẨN H.264/AVC

    • V.1 TRUYỀN HÌNH INTERNET IPTV

    • V.2 TRUYỀN HÌNH VỆ TINH DVB-S2

    • V.3 TRUYỀN HÌNH DI DỘNG

  • CHƯƠNG VI. MÔ PHỎNG QUÁ TRÌNH NÉN-GIẢI NÉN CỦA H.264/AVC BẰNG MATLAB

    • VI.1 LƯU ĐỒ GIẢI THUẬT

    • VI.2 CHƯƠNG TRÌNH MÔ PHỎNG:

    • VI.3 KẾT QUẢ MÔ PHỎNG

  • PHỤ LỤC

  • TÀI LIỆU THAM KHẢO

Nội dung

CƠ SỞ VỀ NÉN TÍN HIỆU VIDEO

SỰ CẦN THIẾT CỦA NÉN TÍN HIỆU

Tín hiệu video số chứa lượng dữ liệu lớn, gây khó khăn trong việc lưu trữ và truyền tải qua băng thông hạn chế Với sự tiến bộ công nghệ, bộ cảm biến màu hiện nay có độ phân giải lên đến 16 triệu pixel, tương đương 4096x4096 pixels Tuy nhiên, độ phân giải cao nhất trong ứng dụng thực tế hiện tại chỉ đạt 1920x1080 pixels Do đó, việc nén tín hiệu là cần thiết để tiết kiệm không gian lưu trữ và băng thông truyền tải.

GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN

Quá trình nén ảnh diễn ra nhờ vào việc tổ chức và trật tự của thông tin trong bức ảnh, cho phép loại bỏ thông tin dư thừa và giữ lại các thông tin quan trọng, giảm số lượng bit khi lưu trữ và truyền tải mà vẫn đảm bảo tính thẩm mỹ Tại đầu thu, bộ giải mã có khả năng tổ chức và tái tạo bức ảnh gần giống với bản gốc, đồng thời vẫn giữ lại thông tin cần thiết Tín hiệu video thường chứa nhiều thông tin dư thừa, được phân loại thành 5 loại khác nhau.

Trong một bức ảnh hoặc khung video, có sự dư thừa thông tin về không gian, thể hiện qua việc các điểm ảnh lân cận trong cùng một khung hình thường chứa thông tin tương tự, được gọi là thừa tĩnh bên trong từng frame.

 Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video trong chuỗi ảnh video, còn gọi là thừa động giữa các frame

 Có sự dư thừa thông tin về phổ: giữa các mẫu của các dữ liệu thu được từ các bộ cảm biến trong camera, máy quay…

 Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng bit với các xác suất xuất hiện không đồng đều.

Sự dư thừa tâm thị giác xảy ra khi thông tin không tương thích với hệ thống thị giác của con người, đặc biệt là khi tần số vượt quá khả năng cảm nhận của mắt Việc nén tín hiệu mang lại nhiều ưu điểm, giúp tối ưu hóa thông tin và cải thiện hiệu suất truyền tải.

 Tiết kiệm băng thông kênh truyền ( trong thời gian thực hoặc nhanh hơn).

 Kéo dài thời giản sử dụng của thiết bị lưu trữ, giảm chi phí đầu tư cho thiết bị lưu trữ.

 Giảm dung lượng thông tin mà không làm mất tính trung thực của hình ảnh

Có nhiều phương pháp nén tín hiệu, trong đó phương pháp nén bằng cách số hóa tín hiệu vẫn giữ được hiệu quả qua các thời đại Phương pháp này không chỉ giúp giảm thiểu đáng kể lượng thông tin không quan trọng mà còn nâng cao tính bảo mật cho tín hiệu.

QUÁ TRÌNH SỐ HÓA TÍN HIỆU

Quá trình số hóa tín hiệu tương tự bao gồm các bước quan trọng như lọc trước, lấy mẫu, lượng tử và mã hóa Lọc trước giúp loại bỏ các tần số không mong muốn, đảm bảo tín hiệu được xử lý chính xác hơn.

GVHD là một bộ lọc chống nhiễu xuyên kênh, được gọi là bộ lọc Aliasing Bộ lọc này không chỉ giúp cải thiện tín hiệu mà còn giảm thiểu nhiễu, từ đó nâng cao chất lượng truyền dẫn TS Trần Dũng Trình và sinh viên Nguyễn Quang Hoàng Sơn đã nghiên cứu và trình bày về vai trò quan trọng của bộ lọc này trong việc xử lý tín hiệu.

Phép toán này thực chất là một phép điều biên xung PAM được thực hiện qua các mạch Op-amp với cực khiển strobe, tạo ra giá trị tín hiệu tương tự tại một số hữu hạn các mẫu rời rạc Các mẫu này được lấy cách đều nhau trong một chu kỳ lấy mẫu, và tần số lấy mẫu cần tuân theo định lý Nyquist-Shannon, yêu cầu rằng tần số lấy mẫu phải lớn hơn hoặc bằng hai lần tần số tối đa của tín hiệu.

Trong đó: + fs là tần số lấy mẫu

+ fmax là tần số cực đại của phổ tín hiệu tương tự.

Quá trình lượng tử hóa chuyển đổi một xung lấy mẫu thành xung có biên độ gần nhất với mức lượng tử, giúp biến đổi tín hiệu liên tục thành tín hiệu rời rạc Quá trình này giảm thiểu tạp âm trong hệ thống và chuẩn bị cho việc truyền tín hiệu từ tương tự sang số Sau khi lượng tử hóa, giá trị thập phân của các mẫu được biểu diễn dưới dạng số nhị phân n bit (N= 2^n), trong đó n là độ phân giải lượng tử hóa; độ phân giải càng cao thì độ chính xác càng lớn.

Do ảnh hưởng của việc làm tròn các mức, tín hiệu có thể bị méo dạng do sai số lượng tử, được gọi là méo lượng tử Tỷ số tín hiệu trên méo lượng tử (S/N) được xác định bởi công thức cụ thể.

GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN

Tín hiệu được lấy maãu

Hình I.1: Sơ đồ quá trình tạo tín hiệu số.

Lượng tử hóa có hai loại:

 Lượng tử tuyến tính: phép nén tín hiệu theo quy luật đường cong đồng đều, bước lượng tử bằng nhau.

Lượng tử phi tuyến là phương pháp nén tín hiệu dựa trên quy luật đường cong không đồng đều, tập trung nhiều mức lượng tử ở những vùng tín hiệu nhỏ Trong kỹ thuật nén ảnh và nén video, lượng tử phi tuyến được ưa chuộng hơn cả vì khả năng giảm dung lượng tối đa mà vẫn đảm bảo độ méo lượng tử ở mức chấp nhận được.

Quá trình thay thế các mức điện áp cố định sau khi lượng tử bằng một dãy nhị phân gọi là từ mã, trong đó tất cả các từ mã đều chứa số xung nhị phân cố định Những từ mã này được truyền trong khoảng thời gian giữa hai thời điểm lấy mẫu cạnh nhau Bộ mã có vai trò quan trọng trong việc tái tạo các xung nhị phân hoặc các từ mã từ các giá trị đã lượng tử xuất hiện ở đầu ra của bộ lượng tử hóa.

TỐC ĐỘ BIT VÀ THÔNG LƯỢNG KÊNH TRUYỀN TÍN HIỆU SỐ

Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị thời gian. n f

GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN

+f s là tần số lấy mẫu (Hz)

+ n là số bit nhị phân trong một ký hiệu.

+ C là tốc độ bit (bps).

Là tốc độ số liệu cực đại có thể truyền được trên kênh truyền có độ rộng băng tần B.

+ C là tốc độ bit (bps)

+ S N là tỷ số tín hiệu trên nhiễu trắng.

+ B là băng thông kênh truyền (Hz).

Tốc độ bit lớn hơn giúp tín hiệu tương tự được khôi phục một cách trung thực hơn, nhưng đồng thời cũng yêu cầu dung lượng lưu trữ và băng thông kênh truyền cao hơn Cụ thể, để truyền tín hiệu với tốc độ bit C (bps), băng thông kênh truyền cần đạt mức B C.

Ví dụ: với n = 4, fs = 44,1Khz thì:

Tốc độ truyền thông tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s

Và độ rộng băng tần là B C

QUÁ TRÌNH BIẾN ĐỔI TÍN HIỆU MÀU

GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN

Hình II.2 Minh họa quá trình biến đổi màu.

Hình I.2 Quá trình biến đổi màu

Bức ảnh được chuyển đổi từ định dạng RGB sang YUV để tiết kiệm dung lượng lưu trữ và băng thông truyền tải Trong quá trình giải mã, ảnh sẽ được chuyển đổi ngược lại thành RGB trước khi hiển thị Công thức minh họa cho quá trình chuyển đổi này như sau:

Với k b  k r  k g  1, kb = 0.114, kr = 0.299, khi thế vào công thức (1) thì ta được:

Nên ta có ma trận biến đổi từ RGB sang YUV như sau:

Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:

CÁC TIÊU CHUẨN LẤY MẪU TÍN HIỆU VIDEO SỐ

Kiểu lấy mẫu trong ảnh video là một yếu tố quan trọng trong kỹ thuật nén ảnh Một số kiểu lấy mẫu phổ biến được minh họa trong hình I.3, với những đặc điểm riêng biệt.

 Tốc độ lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 3,375MHz.

 Tốc độ lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz.

Tốc độ lấy mẫu 4:4:4 đảm bảo cả ba thành phần màu đều có cùng độ phân giải, với tần số lấy mẫu tín hiệu chói đạt 13,5MHz và mỗi tín hiệu màu cũng ở mức 13,5MHz.

GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN

 Tốc độ lấy mẫu 4:2:0 - là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz theo cả 2 chiều

Ví dụ : Một bức ảnh có độ phân giải 720 × 576 pixels Độ phân giải của thành phần Y là 720 × 576 pixels được mã hóa bằng từ mã 8 bits.

 Nếu sử dụng kiểu lấy mẫu 4:4:4 thì độ phân giải của thành phần Cb, Cr là 720 ×

576 mẫu cũng được mã hóa bằng từ mã 8 bits.

=> Vậy tổng số bits sử dụng để mã hóa bức ảnh là 720 × 576 × 8 × 3 = 9 953 280 bits

 Nếu sử dụng kiểu lấy mẫu 4:2:0 thì độ phân giải của thành phần Cb, Cr là 360 ×

288 mẫu, cũng được mã hóa bằng từ mã 8 bits.

=> Vậy tổng số bits sử dụng là (720 × 576 × 8) + (360 × 288 × 8) × 2 = 4 976 640 bits

Trong kiểu 4:4:4, tổng số mẫu cần thiết là 12 mẫu, do đó tổng số bit là 12 × 8 = 96 bits, và trung bình là 96/4 = 24 bits/pixel

Trong kiểu 4:2:0, tín hiệu được quét xen kẽ, yêu cầu 6 mẫu: 4 mẫu cho thành phần Y, 1 mẫu cho Cb và 1 mẫu cho Cr Tổng số bits cần thiết là 48 bits, tương đương với 12 bits/pixel.

Ta thấy kiểu lấy mẫu 4:2:0 giảm một ẵ số lượng bits so với 4:4:4, đú cũng chớnh là lý do mà kiểu lấy mẫu này được sử dụng phổ biến

GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN

Hình I.3 Các tiêu chuẩn lấy mẫu phổ biến

MÔ HÌNH NÉN TÍN HIỆU VIDEO

- Khối nén dư thừa thời gian.

- Khối nén dư thừa theo không gian.

 Xắp xếp lại trật tự và mã hóa Entropy

Tín hiệu video có dải phổ từ 0 đến 6 MHz, với năng lượng chủ yếu tập trung ở miền tần số thấp do các thành phần tần số cao chỉ xuất hiện ở đường viền hình ảnh Điều này dẫn đến việc số lượng bit ở miền tần số thấp nhiều hơn so với miền tần số cao.

Trong các hệ thống nén, tỉ số nén là một tham số quan trọng để đánh giá khả năng nén của hệ thống Nếu n1 và n2 lần lượt là số lượng bit của tín hiệu trước và sau khi nén, ta có thể tính tỉ số nén theo công thức n1/n2.

Tỷ số nén sẽ là

Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương đối.

GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN

Nén thời gian Nén không gian

Hình I.4 Sơ đồ khối nén tín hiệu Video cơ bản

Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là không có sự dư thừa dữ liệu.

Nếu n2

Ngày đăng: 23/06/2021, 13:33

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w