Tính năng Scalable Video Coding (SVC) được bổ sung vào giai đoạn 200507.Video được nén dùng tính năng này sẽ có 1 dòng bit chính và các dòng bit con, dòng bit chính có thể được giải mã bởi bộ H.264AVC codec không hỗ trợ SVC.Tuỳ vào mục đích sử dụng và hệ thống nghe nhìn, các dòng bit con có thể có tần số lấy mẫu thấp hơn hoặc độ phân giải, chất lượng hình ảnh thấp hơn dòng bit chính.
Trang 1XỬ LÝ DỮ LIỆU ĐA
PHƯƠNG TIỆN
ĐỀ TÀI 6: Phương pháp mã hóa dải
tần con và ứng dụng
Nhóm sinh viên thực hiện:
1.Lê Thị Kim Anh 20114612
Trang 2Nội dung và phân công công việc
VIÊN
1 Tìm hiểu và giải thích sơ đồ
nguyên tắc mã hóa dải tần con Thái Thị Lộc
2 Tìm hiểu và so sánh sơ đồ phân
tách giải tần con trong nén ảnh và
trong mã hóa mp3
Nguyễn Thị Kim Anh và Nguyễn Thành Lợi
3 Thuật toán xử lý dự liệu thực hiện
sơ đồ phân tách dải tần con trong
nén ảnh jpeg2000 và cài đặt thử
nghiệm thuật toán
Bùi Tuấn Ánh
Trang 3GIỚI THIỆU CHUNG MÃ HÓA DẢI TẦN CON
1 Nguyên lý chung
2 Quá trình mã hóa
Trang 4NGUYÊN LÝ CHUNG MÃ HÓA SBC
• Mã hóa các dải tần con phân tách tín hiệu nguồn (TH số) thành các tín hiệu trên các dải tần con bằng kĩ thuật lọc số nhờ bộ lọc số, tín hiệu trên mỗi dải tần được mã hóa riêng biệt từng thành phần
• Các dải tần con không chồng chập lên nhau mà thực chất là liền kề nhau Mã hóa riêng các dải tần cho phép đạt hiệu quả nén tốt hơn Việc nhận tín hiệu, giải mã và khôi phục TH ban đầu được thực hiện theo trình tự ngược lại
• Mã hóa dải tần con được ứng dụng rộng rãi trong né dữ liệu audio, video
Trang 5NGUYÊN LÝ CHUNG MÃ HÓA SBC
Trường hợp 1D discrete signal
Trang 6NGUYÊN LÝ CHUNG MÃ HÓA SBC
• Đầu vào là TH cần mã hóa X[n] được phân tách thành 2 dải tần con bởi bộ lọc thông thấp (H0) và bộ lọc thông cao (H1) -> thực hiện lấy mẫu tần số giảm (tần số của TH được giảm đi 2 lần => chu kì lấy mẫu T tăng lên 2 lần)
=> số mẫu sẽ giảm đi và thu được các dảu tần con.
• Sau khi thu được các subband thực hiện các phương pháp mã hóa trên dải tần con.
• Hiệu năng của giải pháp nén được đánh giá qua:
- Tỉ số nén: phụ thuộc vào cả quá trình subband và coding
- Độ tổn hao phụ thuộc vào lượng tử hóa Q
Trang 7
QUÁ TRÌNH MÃ HÓA CÁC DẢI TẦN CON
Sơ đồ mã hóa các dải tần con SBC
Trang 8QUÁ TRÌNH MÃ HÓA CÁC DẢI TẦN CON
Lọc phân tích
Tín hiệu X[n] được đưa qua các bộ lọc, gọi là bank lọc phân tích nhằm chia tín hiệu thành các thành phần tín hiệu ứng với các dải tần không chồng nhau
Các bộ lọc băng con được thiết kế xấp xỉ thỏa mãn tiêu chuẩn của các đáp ứng tần số không chồng chéo
Trang 9QUÁ TRÌNH MÃ HÓA CÁC DẢI TẦN CON
Lấy mẫu các dải tần con (sub – sampled)
•Mỗi đầu ra của bank lọc - tín hiệu của các dải tần được lấy mẫu xuống, tức là giảm tần số lấy mẫu đi M lần (M là số dải tần chia tín hiệu) Việc giảm tần số lấy mẫu làm phổ rộng ra, trải hết trục tần số Số mẫu lúc này cũng giảm theo
•Giảm tần số lấy mẫu được thực hiện dựa theo định lý lấy mẫu Nyquist
và hệ quả của định lý Nyquist
Trang 10QUÁ TRÌNH MÃ HÓA CÁC DẢI TẦN CON
Lượng tử hóa và mã hóa
Thực hiện lượng tử hoá và mã hoá riêng độc lập trên từng dải tần con Lựa chọn phương pháp lượng tử hoá và mã hoá, thực hiện và phân phối bit dựa trên nội dung thông tin mỗi băng con Đây là bước mang lại hiệu quả nén cho toàn
bộ quá trình mã hoá SBC.
Phân phối bit là việc phân chia số bit hiện có cho mã hoá từng dải tùy theo năng lượng tín hiệu trong băng con đó Những băng con có NL lớn, tập trung, mã hóa với số lượng bit lớn Ngược lại, những băng con có năng lượng thấp, mã hóa với số lượng bit thấp hơn => tiết kiệm được số bit cần truyền hoặc lưu trữ Năng lượng tỷ lệ với thông tin nên NL càng lớn thì số bit mã hóa càng lớn để cho tỷ lệ nén TH cao nhất có thể
Trang 11Sơ đồ subband trong mp3
Trang 12Qúa trình thực hiện
• Chia tín hiệu nguồn thành các tín hiệu trên các dải tần con khác nhau bằng cách sử dụng một băng lọc song song cách đều nhau chứa 32 bộ lọc phân tích
• Tín hiệu của các dải tần được giảm tần số lấy mẫu đi 32 lần
Trang 13Các bước thực hiện
• chia tín hiệu nguồn thành các tín hiệu trên các dải tần con khác nhau bằng cách sử dụng một băng lọc song song cách đều nhau chứa 32 bộ lọc phân tích
• Đầu ra của bang con được nối với biến đổi cosin rời rạc MDCT
• Việc phân chia băng con là lợi dụng đặc điểm độ nhạy của tai đối với các thành phần tần số khác nhau
Trang 14Sơ đồ cơ bản
Trang 15• Đầu vào của sơ đồ là tín hiệu gốc ban đầu, được cho qua 2 bộ lọc
thông thấp – thông cao, sau quá trình này sẽ thu được 2 dải tần con tương ứng với hai bộ lọc, tín hiệu tương ứng hai dải tần con này sẽ được lấy mẫu xuống hai lần Quá trình này sẽ được tiếp tục với hai băng tần con này, tùy thuộc vào ứng dụng mà người thiết kế có thể
sử dụng bao nhiêu băng lọc
• Trong sơ đồ này, quá trình subsampling hay còn gọi là giảm tần số lấy mẫu đi 2 lần chính là quá trình xử lý đa phân giải Xét với ảnh, việc
giảm tần số lấy mẫu chính là giảm độ phân giải, tùy thuộc vào số
lượng băng lọc mà có thể xác định các độ phân giải khác nhau
Trang 18• LL : Thành phần sau khi đi qua 2 bộ lọc thông thấp, chứa phần lớn dữ liệu ảnh gốc Đây chính là thành phần thô của ảnh.
• LH : Thành phần đi qua bộ lọc thông thấp rồi đến bộ lọc thông cao
• HL : Thành phần đi qua bộ lọc thông cao rồi đến bộ lọc thông thấp, chứa phần lớn dữ liệu về biên của ảnh gốc
• HH : Thành phần sau khi đi qua 2 bộ lọc thông cao, chứa rất ít dữ liệu ảnh gốc
• Sau khi thu được 4 thành phần, do 2 thành phần LH và HH chứa ít dữ liệu ảnh gốc trong khi thành phần LL và HL chứa phần lớn dữ liệu ảnh gốc và biên của nó nên ở các bước sau đó, ta có thể loại bỏ 2 thành phần LH và
HH, chỉ xử lý các thành phần LL và HL.
Trang 19So sánh subband trong JPEG-2000
và MP3
• Trong nén MP3, bang lọc được sử dụng là bang lọc thông dải gồm 32 bộ loc có đáp ứng tần số khác nhau, còn trong JPEG-2000 sử dụng bộ lọc thông thấp thông cao
• Subban trong nén MP3 dựa trên hiệu ứng che, nén ảnh JPEG-2000 chia tín hiệu dựa trên phân bố năng lượng
• Nén ảnh loại bỏ các thành phần tần số chứa ít thông tin ngay sau qúa trình lọc, còn nén âm thanh trong MP3 loại bỏ thành phần tần số dựa theo ngướng nghe
• Trong nén MP3 tín hiệu đầu vào sẽ đưa vào băng lọc cùng một lúc, trong
JPEG-2000 tín hiệu được đưa qua nhiều tầng bộ lọc với tín hiệu đầu ra của bộ lọc tầng trên là đầu vào của bộ lọc tầng dưới
• Trong nén MP3 tín hiệu được chia thành các dải tần có độ rộng đều nhau, và
bằng 1/32 tín hiệu ban đầu , trong JPEG-2000 tạo ra các dải tần không đều nhau,
độ rộng của từng dải tần và mức độ down sampling của từng nhánh phụ thuộc vào độ sâu của nhánh trên
Trang 20Subband coding trong jpeg 2000
• Sơ đồ subband
Level1 Level2
Trang 21Sơ đồ nén ảnh
Anh sau khi
tien xu ly
Nhân chập Scal, giảm mẫu
Nhân chập Scal, giảm mẫu
Img_scal
Img_wave
Nhân chập Scal, gảm mẫu
Nhân chập Wave, giảm mẫu
Nhân chập Scal, giảm mẫu
Nhân chập Scal, giảm mẫu
Img_LL
Img_LH Img_HL
Img_HH
Level 1
Nhân chập Scal, giảm mẫu
Nhân chập Scal, giảm mẫu
Img_scal
Img_wave
Nhân chập Scal, gảm mẫu
Nhân chập Wave, giảm mẫu
Nhân chập Scal, giảm mẫu
Nhân chập Scal, giảm mẫu
Img_LL_2
Img_LH_2 Img_HL_2
Img_HH_2
Level 2
Trang 22Thêm 0 (Upsample) Nhân chập wave
SƠ ĐỒ GIẢI NÉN
Thêm 0 (Upsample) Nhân chập scal
Thêm 0 (Upsample) Nhân chập scal
Thêm 0 (Upsample) Nhân chập scal
Thêm 0 (Upsample) Nhân chập wave
Thêm 0 (Upsample) Nhân chập scal
Thêm 0 (Upsample) Nhân chập wave
Thêm 0 (Upsample) Nhân chập wave
Thêm 0 (Upsample) Nhân chập scal
Thêm 0 (Upsample) Nhân chập wave
Trang 23THUẬT TOÁN
SUBBAND CODING TRONG JPEG2000
Trang 24THUẬT
TOÁN
GIẢI NÉN SUBAND TRONG JPEG2000
Trang 26Nhận xét khi điều chỉnh các tham số
Xét với cùng 1 sai số ta có:
•Khi tang level của subband thì cho tỉ lệ nén cao hơn
•Kích thước ảnh càng lớn thường cho kết quả tốt hơn
•Daubechies thường cho kết qua tốt hơn ( vì Daubechies-4tap tính toán dựa trên 4 điểm gần nhau thay vì haar chỉ có 2 điểm)
•Daubechies có thời gian tính toán lớn hơn (tính toán nhiều hơn)
•Việc chia ma trận thành các tiles giúp giảm thời gian tính toán giảm bộ nhớ nhưng lại làm giảm tỉ lệ nén