Cơ sở về nén tín hiệu Video
Sự cần thiết của nén tín hiệu
Tín hiệu video số chứa lượng dữ liệu lớn, gây khó khăn trong việc lưu trữ và truyền tải qua băng thông hạn chế Với sự tiến bộ công nghệ, bộ cảm biến màu hiện nay có độ phân giải lên đến 16 triệu pixel, tương đương 4096x4096 pixels Tuy nhiên, ứng dụng thực tế chỉ cần độ phân giải tối đa 1920x1080 pixel Do đó, việc nén tín hiệu là cần thiết để tiết kiệm không gian lưu trữ và băng thông truyền tải.
Quá trình nén ảnh diễn ra nhờ vào việc tổ chức và trật tự của thông tin trong bức ảnh, giúp loại bỏ thông tin dư thừa và giữ lại những thông tin quan trọng, từ đó giảm số lượng bit cần thiết cho lưu trữ và truyền tải mà vẫn đảm bảo tính thẩm mỹ Tại đầu thu, bộ giải mã có khả năng tổ chức và sắp xếp lại bức ảnh gần chính xác so với bản gốc, giữ lại các thông tin cần thiết Tín hiệu video thường chứa nhiều thông tin dư thừa và được phân loại thành 5 loại khác nhau.
Trong mỗi bức ảnh hoặc khung video, có sự dư thừa thông tin về không gian, thể hiện qua các điểm ảnh lân cận trong cùng một phạm vi Hiện tượng này được gọi là thừa tĩnh bên trong từng frame.
Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video trong chuỗi ảnh video, còn gọi là thừa động giữa các frame
Có sự dư thừa thông tin về phổ: giữa các mẫu của các dữ liệu thu được từ các bộ cảm biến trong camera, máy quay…
Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng bit với các xác suất xuất hiện không đồng đều.
Sự dư thừa tâm thị giác xảy ra khi thông tin không tương thích với hệ thống thị giác của con người, đặc biệt là những tần số quá cao mà mắt người không thể cảm nhận Việc nén tín hiệu mang lại nhiều ưu điểm, giúp tối ưu hóa quá trình truyền tải và lưu trữ thông tin, đồng thời cải thiện hiệu suất và chất lượng hình ảnh.
Tiết kiệm băng thông kênh truyền ( trong thời gian thực hoặc nhanh hơn).
Kéo dài thời giản sử dụng của thiết bị lưu trữ, giảm chi phí đầu tư cho thiết bị lưu trữ.
Giảm dung lượng thông tin mà không làm mất tính trung thực của hình ảnh
Có nhiều phương pháp nén tín hiệu, trong đó phương pháp nén bằng cách số hóa tín hiệu vẫn giữ vai trò quan trọng Phương pháp này không chỉ giúp giảm đáng kể lượng thông tin không cần thiết mà còn tăng cường tính bảo mật cho tín hiệu.
Quá trính số hóa tín hiệu
Quá trình số hoá tín hiệu tương tự bao gồm các bước lọc trước, lấy mẫu, lượng tử và mã hoá Lọc trước giúp loại bỏ tần số không cần thiết và nhiễu, với bộ lọc này được gọi là bộ lọc chống nhiễu xuyên kênh Aliasing.
Phép toán rời rạc này, hay còn gọi là phép điều biên xung PAM, được thực hiện thông qua các mạch Op-amp với cực khiển strobe Quá trình này tạo ra tín hiệu tương tự tại một số giá trị rời rạc hữu hạn, được gọi là các mẫu Các mẫu này được lấy cách đều nhau trong một chu kỳ lấy mẫu, và tần số lấy mẫu cần phải tuân theo định lý Nyquist-Shannon.
Trong đó: + fs là tần số lấy mẫu
+ fmax là tần số cực đại của phổ tín hiệu tương tự.
Quá trình lượng tử là chuyển đổi xung lấy mẫu thành xung có biên độ gần nhất với mức lượng tử, tức là chuyển đổi các mức biên độ của tín hiệu đã lấy mẫu sang các giá trị nhị phân hữu hạn Lượng tử hoá giúp biến đổi tín hiệu liên tục theo thời gian thành tín hiệu có biên độ rời rạc, giảm thiểu tạp âm trong hệ thống, hạn chế các mức cho phép của tín hiệu lấy mẫu và chuẩn bị cho việc truyền tín hiệu gốc từ dạng tương tự sang dạng số.
Giá trị thập phân của các mẫu sau khi lượng tử hóa được biểu diễn dưới dạng số nhị phân n bit (N = 2^n) Độ phân giải lượng tử hóa n càng lớn, độ chia càng mịn, dẫn đến độ chính xác càng cao.
Do việc làm tròn các mức tín hiệu, tín hiệu có thể bị méo dạng do sai số lượng tử, được gọi là méo lượng tử Tỷ số tín hiệu trên méo lượng tử (S/N) được xác định bởi các yếu tố liên quan đến độ chính xác và chất lượng tín hiệu.
Hình 1-1 Sơ đồ quá trình tạo tín hiệu số
Lượng tử hóa có hai loại:
Lượng tử tuyến tính: phép nén tín hiệu theo quy luật đường cong đồng đều, bước lượng tử bằng nhau.
Lượng tử phi tuyến là phương pháp nén tín hiệu theo quy luật đường cong không đồng đều, tập trung nhiều mức lượng tử ở các vùng tín hiệu nhỏ Kỹ thuật này thường được áp dụng trong nén ảnh và nén video, giúp giảm dung lượng tối đa mà vẫn giữ được độ méo lượng tử trong giới hạn chấp nhận được.
Quá trình thay thế mỗi mức điện áp cố định sau khi lượng tử bằng một dãy nhị phân được gọi là từ mã Tất cả các từ mã này đều chứa số xung nhị phân cố định và được truyền trong khoảng thời gian giữa hai thời điểm lấy mẫu liên tiếp Bộ mã được sử dụng để tái tạo các xung nhị phân hoặc các từ mã từ các giá trị đã lượng tử xuất hiện ở đầu ra của bộ lượng tử hóa.
Tốc độ bít và thông lượng kênh truyền tín hiệu số
Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị thời gian.
+là tần số lấy mẫu (Hz)
+ n là số bit nhị phân trong một ký hiệu.
+ C là tốc độ bit (bps).
1.3.2 Thông lượng kênh truyền tín hiệu số
Là tốc độ số liệu cực đại có thể truyền được trên kênh truyền có độ rộng băng tần B.
+ C là tốc độ bit (bps)
+ là tỷ số tín hiệu trên nhiễu trắng.
+ B là băng thông kênh truyền (Hz).
Tốc độ bit cao mang lại tín hiệu tương tự chính xác hơn, nhưng đồng thời cũng yêu cầu dung lượng lưu trữ và băng thông kênh truyền lớn hơn Để truyền tín hiệu với tốc độ bit C (bps), cần có băng thông kênh truyền tương ứng là (Hz).
Ví dụ: với n = 4, fs = 44,1Khz thì:
Tốc độ truyền thông tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s
Và độ rộng băng tần là
Quá trình biến đổi tín hiệu màu
Hình 1-2 Quá trình biến đổi tín hiệu màu
Bức ảnh được chuyển đổi từ định dạng RGB sang YUV để giảm dung lượng lưu trữ và truyền tải Trong quá trình giải mã, trước khi hiển thị, ảnh sẽ được chuyển đổi ngược lại thành RGB Công thức minh họa cho quá trình này như sau:
Với , kb = 0.114, kr = 0.299, khi thế vào công thức (1) thì ta được:
Nên ta có ma trận biến đổi từ RGB sang YUV như sau:
Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:
Các tiêu chuẩn lấy mẫu video tín hiệu số
Kiểu lấy mẫu trong ảnh video đóng vai trò quan trọng trong kỹ thuật nén ảnh Một số kiểu lấy mẫu phổ biến được minh họa như hình I.3, mỗi kiểu có những đặc điểm riêng biệt.
Tốc độ lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 3,375MHz.
Tốc độ lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz.
Tốc độ lấy mẫu 4:4:4 đảm bảo rằng cả ba thành phần màu đều có cùng độ phân giải, với tần số lấy mẫu tín hiệu chói đạt 13,5MHz và mỗi tín hiệu màu cũng ở mức 13,5MHz.
Tốc độ lấy mẫu 4:2:0 - là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz theo cả 2 chiều
Ví dụ : Một bức ảnh có độ phân giải 720 × 576 pixels Độ phân giải của thành phần Y là 720 × 576 pixels được mã hóa bằng từ mã 8 bits.
Nếu sử dụng kiểu lấy mẫu 4:4:4 thì độ phân giải của thành phần Cb, Cr là 720 ×
576 mẫu cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng để mã hóa bức ảnh là 720 × 576 × 8 × 3 = 9 953 280 bits
Nếu sử dụng kiểu lấy mẫu 4:2:0 thì độ phân giải của thành phần Cb, Cr là 360 ×
288 mẫu, cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng là (720 × 576 × 8) + (360 × 288 × 8) × 2 = 4 976 640 bits
Hình 1-3 Các tiêu chuẩn lấy mẫu phổ biến
Trong kiểu 4:4:4, tổng số mẫu cần thiết là 12 mẫu, do đó tổng số bit là 12 × 8 = 96 bits, và trung bình là 96/4 = 24 bits/pixel
Trong cấu trúc 4:2:0, tín hiệu được quét theo phương pháp xen kẽ, yêu cầu 6 mẫu tổng cộng: 4 mẫu cho thành phần Y, 1 mẫu cho thành phần Cb và 1 mẫu cho thành phần Cr.
Ta thấy kiểu lấy mẫu 4:2:0 giảm một ẵ số lượng bits so với 4:4:4, đú cũng chớnh là lý do mà kiểu lấy mẫu này được sử dụng phổ biến.
Mô hình nén tín hiệu Video
Hình 1-4 Sơ đồ khối nén tín hiệu video
- Khối nén dư thừa thời gian.
- Khối nén dư thừa theo không gian.
Xắp xếp lại trật tự và mã hóa Entropy
Tín hiệu video có dải phổ từ 0 đến 6 MHz, với năng lượng chủ yếu tập trung ở miền tần số thấp do các thành phần tần số cao chỉ xuất hiện ở đường viền hình ảnh Điều này dẫn đến việc số lượng bit ở miền tần số thấp nhiều hơn so với miền tần số cao.
Trong các hệ thống nén, tỉ số nén là một tham số quan trọng để đánh giá khả năng nén của hệ thống Nếu n1 và n2 lần lượt là số lượng bit của tín hiệu trước và sau khi nén, ta có thể sử dụng công thức để tính toán tỉ số nén.
Tỷ số nén sẽ là
Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương đối.
Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là không có sự dư thừa dữ liệu.
Nếu n2