LUẬN VĂN TỐT NGHIỆP THẠC SĨ Mô phỏng để thấy rõ sự khác biệt giữa HEVC và H.264/AVC

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	85
Dung lượng	3,36 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP
BẢN NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP
LỜI NÓI ĐẦU
TỔ CHỨC ĐỒ ÁN
TÓM TẮT ĐỒ ÁN
ABSTRACT
DANH MỤC HÌNH VẼ
DANH MỤC BẢNG BIỂU
CÁC THUẬT NGỮ VIẾT TẮT
Chương 1. Cơ sở về nén tín hiệu Video
- 1.1 Sự cần thiết của nén tín hiệu
- 1.2 Quá trính số hóa tín hiệu
  - 1.2.1 Lấy mẫu
  - 1.2.2 Lượng tử hóa
  - 1.2.3 Mã hóa
- 1.3 Tốc độ bít và thông lượng kênh truyền tín hiệu số
  - 1.3.1 Tốc độ bit
  - 1.3.2 Thông lượng kênh truyền tín hiệu số
- 1.4 Quá trình biến đổi tín hiệu màu
- 1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số
- 1.6 Mô hình nén tín hiệu Video
  - 1.6.1 Nén tín hiệu Video
  - 1.6.2 Lượng tin trung bình
Chương 2. Các kĩ thuật nén Video
- 2.1 Phân loại kĩ thuật nén
- 2.2 Quá trình biến đổi
  - 2.2.1 Điều xung mã vi sai DPCM
  - 2.2.2 Mã hóa biến đổi
    - 2.2.2.1 Biến đổi cosin rời rạc DCT
    - 2.2.2.2 Biến đổi Hadamard
- 2.3 Quá trình lượng tử
  - 2.3.1 Lượng tử vô hướng
  - 2.3.2 Lượng tử vector
- 2.4 Quá trình mã hóa
  - 2.4.1 Mã hóa độ dài thay đổi
    - 2.4.1.1 Mã hóa Huffman
    - 2.4.1.2 Mã hóa mức dọc chiều dài RLC
  - 2.4.2 Mã hóa số học
- 2.5 Tiêu chuẩn đánh giá chất lượng ảnh nén
Chương 3. Các chuẩn nén thuộc họ MPEC trước H.265/HEVC
- 3.1 Giới thiệu về lịch sử phát triển của chuẩn MPEG
- 3.2 Các tiêu chuẩn nén trước H.265/HEVC
  - 3.2.1 Tiêu chuẩn MPEC-1
    - 3.2.1.1 Các đặc điểm của tiêu chuẩn MPEG-1
    - 3.2.1.2 Cấu trúc dòng bít của MPEG-1
  - 3.2.2 Tiêu chuẩn MPEG-2
    - 3.2.2.1 Các đặc điểm của tiêu chuẩn MPEG-2
    - 3.2.2.2 Sự khác nhau chính giữa MPEG-1 và MPEG-2
  - 3.2.3 Tiêu chuẩn MPEC-4
  - 3.2.4 Tiêu chuẩn H.264
    - 3.2.4.1 Giới thiệu chung
    - 3.2.4.2 Các ứng dụng hiện đang sử dụng H.264/AVC
    - 3.2.4.3 So sánh H.264/AVC và các chuẩn trước đó
      - 3.2.4.3.1 Quá trình dự đoán liên khung (intra -Prediction)
      - 3.2.4.3.2 Bộ lọc vòng (Loop Filter)
      - 3.2.4.3.3 Mã hóa Entropi
Chương 4. Chuẩn nén H.265/HEVC
- 4.1 Tổng quan về chuẩn nén H.265/HEVC
  - 4.1.1 Lịch sử phát triển của chuẩn nén H.265/HEVC
  - 4.1.2 Lịch trình triển khai và các sản phẩm liên quan
    - 4.1.2.1 Năm 2012
    - 4.1.2.2 Năm 2013
    - 4.1.2.3 Năm 2014
  - 4.1.3 Các profiles và levels của chuẩn HEVC
    - 4.1.3.1 Các profiles
    - 4.1.3.2 Các levels
- 4.2 Kĩ thuật nén video HEVC
  - 4.2.1 Giải thích hoạt động cơ bản
  - 4.2.2 Cấu trúc Mã hóa (Coding Structure)
Chương 5. Những điểm tối ưu của HEVC so với H.264/AVC
- 5.1 Sự tối ưu trên lý thuyết
- 5.2 Sự khác biệt qua mô phỏng với hình ảnh cụ thể
  - 5.2.1 Trong H.264/AVC
  - 5.2.2 Trong HEVC
  - 5.2.3 So sánh HEVC và H.264/AVC
TÀI LIỆU THAM KHẢO
BẢNG ĐỐI CHIẾU THUẬT NGỮ VIỆT – ANH
PHỤ LỤC

Nội dung

Cơ sở về nén tín hiệu Video

Sự cần thiết của nén tín hiệu

Tín hiệu video số chứa lượng dữ liệu lớn, gây khó khăn trong việc lưu trữ và truyền tải qua băng thông hạn chế Với sự tiến bộ công nghệ, bộ cảm biến màu hiện nay có độ phân giải lên đến 16 triệu pixel, tương đương 4096x4096 pixels Tuy nhiên, ứng dụng thực tế chỉ cần độ phân giải tối đa 1920x1080 pixel Do đó, việc nén tín hiệu là cần thiết để tiết kiệm không gian lưu trữ và băng thông truyền tải.

Quá trình nén ảnh diễn ra nhờ vào việc tổ chức và trật tự của thông tin trong bức ảnh, giúp loại bỏ thông tin dư thừa và giữ lại những thông tin quan trọng, từ đó giảm số lượng bit cần thiết cho lưu trữ và truyền tải mà vẫn đảm bảo tính thẩm mỹ Tại đầu thu, bộ giải mã có khả năng tổ chức và sắp xếp lại bức ảnh gần chính xác so với bản gốc, giữ lại các thông tin cần thiết Tín hiệu video thường chứa nhiều thông tin dư thừa và được phân loại thành 5 loại khác nhau.

Trong mỗi bức ảnh hoặc khung video, có sự dư thừa thông tin về không gian, thể hiện qua các điểm ảnh lân cận trong cùng một phạm vi Hiện tượng này được gọi là thừa tĩnh bên trong từng frame.

 Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video trong chuỗi ảnh video, còn gọi là thừa động giữa các frame

 Có sự dư thừa thông tin về phổ: giữa các mẫu của các dữ liệu thu được từ các bộ cảm biến trong camera, máy quay…

 Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng bit với các xác suất xuất hiện không đồng đều.

Sự dư thừa tâm thị giác xảy ra khi thông tin không tương thích với hệ thống thị giác của con người, đặc biệt là những tần số quá cao mà mắt người không thể cảm nhận Việc nén tín hiệu mang lại nhiều ưu điểm, giúp tối ưu hóa quá trình truyền tải và lưu trữ thông tin, đồng thời cải thiện hiệu suất và chất lượng hình ảnh.

 Tiết kiệm băng thông kênh truyền ( trong thời gian thực hoặc nhanh hơn).

 Kéo dài thời giản sử dụng của thiết bị lưu trữ, giảm chi phí đầu tư cho thiết bị lưu trữ.

 Giảm dung lượng thông tin mà không làm mất tính trung thực của hình ảnh

Có nhiều phương pháp nén tín hiệu, trong đó phương pháp nén bằng cách số hóa tín hiệu vẫn giữ vai trò quan trọng Phương pháp này không chỉ giúp giảm đáng kể lượng thông tin không cần thiết mà còn tăng cường tính bảo mật cho tín hiệu.

Quá trính số hóa tín hiệu

Quá trình số hoá tín hiệu tương tự bao gồm các bước lọc trước, lấy mẫu, lượng tử và mã hoá Lọc trước giúp loại bỏ tần số không cần thiết và nhiễu, với bộ lọc này được gọi là bộ lọc chống nhiễu xuyên kênh Aliasing.

Phép toán rời rạc này, hay còn gọi là phép điều biên xung PAM, được thực hiện thông qua các mạch Op-amp với cực khiển strobe Quá trình này tạo ra tín hiệu tương tự tại một số giá trị rời rạc hữu hạn, được gọi là các mẫu Các mẫu này được lấy cách đều nhau trong một chu kỳ lấy mẫu, và tần số lấy mẫu cần phải tuân theo định lý Nyquist-Shannon.

Trong đó: + fs là tần số lấy mẫu

+ fmax là tần số cực đại của phổ tín hiệu tương tự.

Quá trình lượng tử là chuyển đổi xung lấy mẫu thành xung có biên độ gần nhất với mức lượng tử, tức là chuyển đổi các mức biên độ của tín hiệu đã lấy mẫu sang các giá trị nhị phân hữu hạn Lượng tử hoá giúp biến đổi tín hiệu liên tục theo thời gian thành tín hiệu có biên độ rời rạc, giảm thiểu tạp âm trong hệ thống, hạn chế các mức cho phép của tín hiệu lấy mẫu và chuẩn bị cho việc truyền tín hiệu gốc từ dạng tương tự sang dạng số.

Giá trị thập phân của các mẫu sau khi lượng tử hóa được biểu diễn dưới dạng số nhị phân n bit (N = 2^n) Độ phân giải lượng tử hóa n càng lớn, độ chia càng mịn, dẫn đến độ chính xác càng cao.

Do việc làm tròn các mức tín hiệu, tín hiệu có thể bị méo dạng do sai số lượng tử, được gọi là méo lượng tử Tỷ số tín hiệu trên méo lượng tử (S/N) được xác định bởi các yếu tố liên quan đến độ chính xác và chất lượng tín hiệu.

Hình 1-1 Sơ đồ quá trình tạo tín hiệu số

Lượng tử hóa có hai loại:

 Lượng tử tuyến tính: phép nén tín hiệu theo quy luật đường cong đồng đều, bước lượng tử bằng nhau.

Lượng tử phi tuyến là phương pháp nén tín hiệu theo quy luật đường cong không đồng đều, tập trung nhiều mức lượng tử ở các vùng tín hiệu nhỏ Kỹ thuật này thường được áp dụng trong nén ảnh và nén video, giúp giảm dung lượng tối đa mà vẫn giữ được độ méo lượng tử trong giới hạn chấp nhận được.

Quá trình thay thế mỗi mức điện áp cố định sau khi lượng tử bằng một dãy nhị phân được gọi là từ mã Tất cả các từ mã này đều chứa số xung nhị phân cố định và được truyền trong khoảng thời gian giữa hai thời điểm lấy mẫu liên tiếp Bộ mã được sử dụng để tái tạo các xung nhị phân hoặc các từ mã từ các giá trị đã lượng tử xuất hiện ở đầu ra của bộ lượng tử hóa.

Tốc độ bít và thông lượng kênh truyền tín hiệu số

Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị thời gian.

+là tần số lấy mẫu (Hz)

+ n là số bit nhị phân trong một ký hiệu.

+ C là tốc độ bit (bps).

1.3.2 Thông lượng kênh truyền tín hiệu số

Là tốc độ số liệu cực đại có thể truyền được trên kênh truyền có độ rộng băng tần B.

+ C là tốc độ bit (bps)

+ là tỷ số tín hiệu trên nhiễu trắng.

+ B là băng thông kênh truyền (Hz).

Tốc độ bit cao mang lại tín hiệu tương tự chính xác hơn, nhưng đồng thời cũng yêu cầu dung lượng lưu trữ và băng thông kênh truyền lớn hơn Để truyền tín hiệu với tốc độ bit C (bps), cần có băng thông kênh truyền tương ứng là (Hz).

Ví dụ: với n = 4, fs = 44,1Khz thì:

Tốc độ truyền thông tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s

Và độ rộng băng tần là

Quá trình biến đổi tín hiệu màu

Hình 1-2 Quá trình biến đổi tín hiệu màu

Bức ảnh được chuyển đổi từ định dạng RGB sang YUV để giảm dung lượng lưu trữ và truyền tải Trong quá trình giải mã, trước khi hiển thị, ảnh sẽ được chuyển đổi ngược lại thành RGB Công thức minh họa cho quá trình này như sau:

Với , kb = 0.114, kr = 0.299, khi thế vào công thức (1) thì ta được:

Nên ta có ma trận biến đổi từ RGB sang YUV như sau:

Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:

Các tiêu chuẩn lấy mẫu video tín hiệu số

Kiểu lấy mẫu trong ảnh video đóng vai trò quan trọng trong kỹ thuật nén ảnh Một số kiểu lấy mẫu phổ biến được minh họa như hình I.3, mỗi kiểu có những đặc điểm riêng biệt.

 Tốc độ lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 3,375MHz.

 Tốc độ lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz.

Tốc độ lấy mẫu 4:4:4 đảm bảo rằng cả ba thành phần màu đều có cùng độ phân giải, với tần số lấy mẫu tín hiệu chói đạt 13,5MHz và mỗi tín hiệu màu cũng ở mức 13,5MHz.

 Tốc độ lấy mẫu 4:2:0 - là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz theo cả 2 chiều

Ví dụ : Một bức ảnh có độ phân giải 720 × 576 pixels Độ phân giải của thành phần Y là 720 × 576 pixels được mã hóa bằng từ mã 8 bits.

 Nếu sử dụng kiểu lấy mẫu 4:4:4 thì độ phân giải của thành phần Cb, Cr là 720 ×

576 mẫu cũng được mã hóa bằng từ mã 8 bits.

=> Vậy tổng số bits sử dụng để mã hóa bức ảnh là 720 × 576 × 8 × 3 = 9 953 280 bits

 Nếu sử dụng kiểu lấy mẫu 4:2:0 thì độ phân giải của thành phần Cb, Cr là 360 ×

288 mẫu, cũng được mã hóa bằng từ mã 8 bits.

=> Vậy tổng số bits sử dụng là (720 × 576 × 8) + (360 × 288 × 8) × 2 = 4 976 640 bits

Hình 1-3 Các tiêu chuẩn lấy mẫu phổ biến

Trong kiểu 4:4:4, tổng số mẫu cần thiết là 12 mẫu, do đó tổng số bit là 12 × 8 = 96 bits, và trung bình là 96/4 = 24 bits/pixel

Trong cấu trúc 4:2:0, tín hiệu được quét theo phương pháp xen kẽ, yêu cầu 6 mẫu tổng cộng: 4 mẫu cho thành phần Y, 1 mẫu cho thành phần Cb và 1 mẫu cho thành phần Cr.

Ta thấy kiểu lấy mẫu 4:2:0 giảm một ẵ số lượng bits so với 4:4:4, đú cũng chớnh là lý do mà kiểu lấy mẫu này được sử dụng phổ biến.

Mô hình nén tín hiệu Video

Hình 1-4 Sơ đồ khối nén tín hiệu video

- Khối nén dư thừa thời gian.

- Khối nén dư thừa theo không gian.

 Xắp xếp lại trật tự và mã hóa Entropy

Tín hiệu video có dải phổ từ 0 đến 6 MHz, với năng lượng chủ yếu tập trung ở miền tần số thấp do các thành phần tần số cao chỉ xuất hiện ở đường viền hình ảnh Điều này dẫn đến việc số lượng bit ở miền tần số thấp nhiều hơn so với miền tần số cao.

Trong các hệ thống nén, tỉ số nén là một tham số quan trọng để đánh giá khả năng nén của hệ thống Nếu n1 và n2 lần lượt là số lượng bit của tín hiệu trước và sau khi nén, ta có thể sử dụng công thức để tính toán tỉ số nén.

Tỷ số nén sẽ là

Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương đối.

Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là không có sự dư thừa dữ liệu.

Nếu n2

Ngày đăng: 13/07/2021, 18:40

Nguồn tham khảo

Tài liệu tham khảo

Loại

Chi tiết

[1] TS. Nguyễn Thanh Bình, Ths. Võ Nguyễn Quốc Bảo, “Xử lý âm thanh, hình ảnh”, Học viện công nghệ Bưu chính viễn thông, Hà Nội

Sách, tạp chí

Tiêu đề:	Xử lý âm thanh, hìnhảnh”

[2] KS. Trương Thị Thủy, “Tiêu chuẩn mã hóa tiên tiến H.264-MPEG-4 AVC”, Tạp chí khoa học kỹ thuật truyền hình 1/2004

Sách, tạp chí

Tiêu đề:	Tiêu chuẩn mã hóa tiên tiến H.264-MPEG-4 AVC”

[3] KS. Cao Văn Liết, “Bù chuyển động trong kỹ thuật mã hóa nội dung nguồn video tự nhiên sử dụng tiêu chuẩn nén MPEG-4”, Tạp chí khoa học kỹ thuật truyền hình 1/2005

Sách, tạp chí

Tiêu đề:	Bù chuyển động trong kỹ thuật mã hóa nội dung nguồnvideo tự nhiên sử dụng tiêu chuẩn nén MPEG-4”

[4]Th.S. Nguyễn Minh Hồng, “Chuẩn nén H.264/AVC và khả năng ứng dụng trong truyền hình”, Tạp chí khoa học kỹ thuật truyền hình 2/2005

Sách, tạp chí

Tiêu đề:	Chuẩn nén H.264/AVC và khả năng ứng dụng trongtruyền hình”

[5] Gs.TS. Nguyễn Kim Sách, “Truyền hình số có nén và Multimedia”, Nhà xuất bản khoa học kỹ thuật, Hà Nội

Sách, tạp chí

Tiêu đề:	Truyền hình số có nén và Multimedia
Nhà XB:	Nhà xuấtbản khoa học kỹ thuật

[6] TS. Trần Dũng Trình, “Truyền hình trên Internet IPTV”, Tạp chí khoa học kỹ thuật truyền hình 3/2005

Sách, tạp chí

Tiêu đề:	Truyền hình trên Internet IPTV”

[7] Iain E. G. Richardson, “H.264 And MPEG-4 Video Compression”, The Robert Gordon University, Aberdeen, UK

Sách, tạp chí

Tiêu đề:	H.264 And MPEG-4 Video Compression”

[8] John Arnold, Michael Frater, Mark Pickering, “Digital Television Technology and Standards”, The University of New South Wales, ADFA Canberra, ACT, Australia

Sách, tạp chí

Tiêu đề:	Digital Television Technologyand Standards”

[9] JVT “Draft ITU-T recommendation and final draft international standard of joint video specification (ITU-T rec. H.264– ISO/IEC 14496-10 AVC),”

Sách, tạp chí

Tiêu đề:	Draft ITU-T recommendation and final draft international standard of jointvideo specification (ITU-T rec. H.264– ISO/IEC 14496-10 AVC)

[10] THOMAS SIKORA, “MPEG-1 and MPEG-2 Digital Video Coding Standards”, McGraw Hill Publishing Company

Sách, tạp chí

Tiêu đề:	MPEG-1 and MPEG-2 Digital Video CodingStandards”

[12] Siwei Ma, Xiaopeng Fan, Wen Gao, “Low Complexity Integer Transform and High Definition Coding”

Sách, tạp chí

Tiêu đề:	Low Complexity Integer Transform andHigh Definition Coding

[13] ITU. 2013-06-07, “H.265 : High efficiency video coding” Retrieved 2013-06- 07

Sách, tạp chí

Tiêu đề:	H.265 : High efficiency video coding

[11] T. Wiegand, G.J. Sullivan, G. Bjontegaard, A. Luthra, ”Overview of the H.264/AVC Video Coding Standard,”

Khác