CƠ SỞ VỀ NÉN TÍN HIỆU VIDEO
SỰ CẦN THIẾT CỦA NÉN TÍN HIỆU
Tín hiệu video số chứa lượng dữ liệu lớn, gây khó khăn trong việc lưu trữ và truyền tải qua băng thông hạn chế Với sự tiến bộ công nghệ, bộ cảm biến màu hiện nay có độ phân giải lên đến 16 triệu pixel, tương đương 4096x4096 pixels Tuy nhiên, độ phân giải cao nhất trong ứng dụng thực tế hiện tại chỉ đạt 1920x1080 pixels Do đó, việc nén tín hiệu là cần thiết để tiết kiệm không gian lưu trữ và băng thông truyền tải.
GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN
Quá trình nén ảnh diễn ra nhờ vào việc tổ chức và trật tự của thông tin trong bức ảnh, cho phép loại bỏ thông tin dư thừa và giữ lại các thông tin quan trọng, giảm số lượng bit khi lưu trữ và truyền tải mà vẫn đảm bảo tính thẩm mỹ Tại đầu thu, bộ giải mã có khả năng tổ chức và tái tạo bức ảnh gần giống với bản gốc, đồng thời vẫn giữ lại thông tin cần thiết Tín hiệu video thường chứa nhiều thông tin dư thừa, được phân loại thành 5 loại khác nhau.
Trong một bức ảnh hoặc khung video, có sự dư thừa thông tin về không gian, thể hiện qua việc các điểm ảnh lân cận trong cùng một khung hình thường chứa thông tin tương tự, được gọi là thừa tĩnh bên trong từng frame.
Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video trong chuỗi ảnh video, còn gọi là thừa động giữa các frame
Có sự dư thừa thông tin về phổ: giữa các mẫu của các dữ liệu thu được từ các bộ cảm biến trong camera, máy quay…
Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng bit với các xác suất xuất hiện không đồng đều.
Sự dư thừa tâm thị giác xảy ra khi thông tin không tương thích với hệ thống thị giác của con người, đặc biệt là khi tần số vượt quá khả năng cảm nhận của mắt Việc nén tín hiệu mang lại nhiều ưu điểm, giúp tối ưu hóa thông tin và cải thiện hiệu suất truyền tải.
Tiết kiệm băng thông kênh truyền ( trong thời gian thực hoặc nhanh hơn).
Kéo dài thời giản sử dụng của thiết bị lưu trữ, giảm chi phí đầu tư cho thiết bị lưu trữ.
Giảm dung lượng thông tin mà không làm mất tính trung thực của hình ảnh
Có nhiều phương pháp nén tín hiệu, trong đó phương pháp nén bằng cách số hóa tín hiệu vẫn giữ được hiệu quả qua các thời đại Phương pháp này không chỉ giúp giảm thiểu đáng kể lượng thông tin không quan trọng mà còn nâng cao tính bảo mật cho tín hiệu.
QUÁ TRÌNH SỐ HÓA TÍN HIỆU
Quá trình số hóa tín hiệu tương tự bao gồm các bước quan trọng như lọc trước, lấy mẫu, lượng tử và mã hóa Lọc trước giúp loại bỏ các tần số không mong muốn, đảm bảo tín hiệu được xử lý chính xác hơn.
GVHD là một bộ lọc chống nhiễu xuyên kênh, được gọi là bộ lọc Aliasing Bộ lọc này không chỉ giúp cải thiện tín hiệu mà còn giảm thiểu nhiễu, từ đó nâng cao chất lượng truyền dẫn TS Trần Dũng Trình và sinh viên Nguyễn Quang Hoàng Sơn đã nghiên cứu và trình bày về vai trò quan trọng của bộ lọc này trong việc xử lý tín hiệu.
Phép toán này thực chất là một phép điều biên xung PAM được thực hiện qua các mạch Op-amp với cực khiển strobe, tạo ra giá trị tín hiệu tương tự tại một số hữu hạn các mẫu rời rạc Các mẫu này được lấy cách đều nhau trong một chu kỳ lấy mẫu, và tần số lấy mẫu cần tuân theo định lý Nyquist-Shannon, yêu cầu rằng tần số lấy mẫu phải lớn hơn hoặc bằng hai lần tần số tối đa của tín hiệu.
Trong đó: + fs là tần số lấy mẫu
+ fmax là tần số cực đại của phổ tín hiệu tương tự.
Quá trình lượng tử hóa chuyển đổi một xung lấy mẫu thành xung có biên độ gần nhất với mức lượng tử, giúp biến đổi tín hiệu liên tục thành tín hiệu rời rạc Quá trình này giảm thiểu tạp âm trong hệ thống và chuẩn bị cho việc truyền tín hiệu từ tương tự sang số Sau khi lượng tử hóa, giá trị thập phân của các mẫu được biểu diễn dưới dạng số nhị phân n bit (N= 2^n), trong đó n là độ phân giải lượng tử hóa; độ phân giải càng cao thì độ chính xác càng lớn.
Do ảnh hưởng của việc làm tròn các mức, tín hiệu có thể bị méo dạng do sai số lượng tử, được gọi là méo lượng tử Tỷ số tín hiệu trên méo lượng tử (S/N) được xác định bởi công thức cụ thể.
GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN
Tín hiệu được lấy maãu
Hình I.1: Sơ đồ quá trình tạo tín hiệu số.
Lượng tử hóa có hai loại:
Lượng tử tuyến tính: phép nén tín hiệu theo quy luật đường cong đồng đều, bước lượng tử bằng nhau.
Lượng tử phi tuyến là phương pháp nén tín hiệu dựa trên quy luật đường cong không đồng đều, tập trung nhiều mức lượng tử ở những vùng tín hiệu nhỏ Trong kỹ thuật nén ảnh và nén video, lượng tử phi tuyến được ưa chuộng hơn cả vì khả năng giảm dung lượng tối đa mà vẫn đảm bảo độ méo lượng tử ở mức chấp nhận được.
Quá trình thay thế các mức điện áp cố định sau khi lượng tử bằng một dãy nhị phân gọi là từ mã, trong đó tất cả các từ mã đều chứa số xung nhị phân cố định Những từ mã này được truyền trong khoảng thời gian giữa hai thời điểm lấy mẫu cạnh nhau Bộ mã có vai trò quan trọng trong việc tái tạo các xung nhị phân hoặc các từ mã từ các giá trị đã lượng tử xuất hiện ở đầu ra của bộ lượng tử hóa.
TỐC ĐỘ BIT VÀ THÔNG LƯỢNG KÊNH TRUYỀN TÍN HIỆU SỐ
Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị thời gian. n f
GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN
+f s là tần số lấy mẫu (Hz)
+ n là số bit nhị phân trong một ký hiệu.
+ C là tốc độ bit (bps).
Là tốc độ số liệu cực đại có thể truyền được trên kênh truyền có độ rộng băng tần B.
+ C là tốc độ bit (bps)
+ S N là tỷ số tín hiệu trên nhiễu trắng.
+ B là băng thông kênh truyền (Hz).
Tốc độ bit lớn hơn giúp tín hiệu tương tự được khôi phục một cách trung thực hơn, nhưng đồng thời cũng yêu cầu dung lượng lưu trữ và băng thông kênh truyền cao hơn Cụ thể, để truyền tín hiệu với tốc độ bit C (bps), băng thông kênh truyền cần đạt mức B C.
Ví dụ: với n = 4, fs = 44,1Khz thì:
Tốc độ truyền thông tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s
Và độ rộng băng tần là B C
QUÁ TRÌNH BIẾN ĐỔI TÍN HIỆU MÀU
GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN
Hình II.2 Minh họa quá trình biến đổi màu.
Hình I.2 Quá trình biến đổi màu
Bức ảnh được chuyển đổi từ định dạng RGB sang YUV để tiết kiệm dung lượng lưu trữ và băng thông truyền tải Trong quá trình giải mã, ảnh sẽ được chuyển đổi ngược lại thành RGB trước khi hiển thị Công thức minh họa cho quá trình chuyển đổi này như sau:
Với k b k r k g 1, kb = 0.114, kr = 0.299, khi thế vào công thức (1) thì ta được:
Nên ta có ma trận biến đổi từ RGB sang YUV như sau:
Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:
CÁC TIÊU CHUẨN LẤY MẪU TÍN HIỆU VIDEO SỐ
Kiểu lấy mẫu trong ảnh video là một yếu tố quan trọng trong kỹ thuật nén ảnh Một số kiểu lấy mẫu phổ biến được minh họa trong hình I.3, với những đặc điểm riêng biệt.
Tốc độ lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 3,375MHz.
Tốc độ lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz.
Tốc độ lấy mẫu 4:4:4 đảm bảo cả ba thành phần màu đều có cùng độ phân giải, với tần số lấy mẫu tín hiệu chói đạt 13,5MHz và mỗi tín hiệu màu cũng ở mức 13,5MHz.
GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN
Tốc độ lấy mẫu 4:2:0 - là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz theo cả 2 chiều
Ví dụ : Một bức ảnh có độ phân giải 720 × 576 pixels Độ phân giải của thành phần Y là 720 × 576 pixels được mã hóa bằng từ mã 8 bits.
Nếu sử dụng kiểu lấy mẫu 4:4:4 thì độ phân giải của thành phần Cb, Cr là 720 ×
576 mẫu cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng để mã hóa bức ảnh là 720 × 576 × 8 × 3 = 9 953 280 bits
Nếu sử dụng kiểu lấy mẫu 4:2:0 thì độ phân giải của thành phần Cb, Cr là 360 ×
288 mẫu, cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng là (720 × 576 × 8) + (360 × 288 × 8) × 2 = 4 976 640 bits
Trong kiểu 4:4:4, tổng số mẫu cần thiết là 12 mẫu, do đó tổng số bit là 12 × 8 = 96 bits, và trung bình là 96/4 = 24 bits/pixel
Trong kiểu 4:2:0, tín hiệu được quét xen kẽ, yêu cầu 6 mẫu: 4 mẫu cho thành phần Y, 1 mẫu cho Cb và 1 mẫu cho Cr Tổng số bits cần thiết là 48 bits, tương đương với 12 bits/pixel.
Ta thấy kiểu lấy mẫu 4:2:0 giảm một ẵ số lượng bits so với 4:4:4, đú cũng chớnh là lý do mà kiểu lấy mẫu này được sử dụng phổ biến
GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN
Hình I.3 Các tiêu chuẩn lấy mẫu phổ biến
MÔ HÌNH NÉN TÍN HIỆU VIDEO
- Khối nén dư thừa thời gian.
- Khối nén dư thừa theo không gian.
Xắp xếp lại trật tự và mã hóa Entropy
Tín hiệu video có dải phổ từ 0 đến 6 MHz, với năng lượng chủ yếu tập trung ở miền tần số thấp do các thành phần tần số cao chỉ xuất hiện ở đường viền hình ảnh Điều này dẫn đến việc số lượng bit ở miền tần số thấp nhiều hơn so với miền tần số cao.
Trong các hệ thống nén, tỉ số nén là một tham số quan trọng để đánh giá khả năng nén của hệ thống Nếu n1 và n2 lần lượt là số lượng bit của tín hiệu trước và sau khi nén, ta có thể tính tỉ số nén theo công thức n1/n2.
Tỷ số nén sẽ là
Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương đối.
GVHD: TS TRẦN DŨNG TRÌNH SVTH : NGUYỄN QUANG HOÀNG SƠN
Nén thời gian Nén không gian
Hình I.4 Sơ đồ khối nén tín hiệu Video cơ bản
Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là không có sự dư thừa dữ liệu.
Nếu n2