SMR signal-mask rate ñược sử dụng ñể xác ñịnh số bit cho quá trình lượng tử hoá ñối với mỗi băng con với mục ñích giảm thiểu dung lượng... – Side Info: Gồm phân bố bit: lớp 1 với 4 bits
Trang 1– Kiến trúc
Băng lọc phân tích ña pha 32 kênh
Lượng tử hoá
Mã hoá
M U X FFT
LI: 512 LII: 1024
Phân tích tâm sinh lý
âm học
Phân phối bit ñộng
32 Dữ liệu
Thông tin thêm SMR Lượng tử
32
Dữ liệu
SMR: Tỷ số tín
hiệu/ngưỡng che
Băng lọc phân tích ña
M U X
FFT
Phân tích tâm sinh lý
âm học
SMR
32
Vòng lặp chỉ ñịnh bit Lượng tử hoá
Mã hoá Huffman
Mã thông tin thêm
↓32
MPEG1 lớp 1,2
MPEG1 lớp 3
Thông tin thêm
MPEG-1
• Thuật toán cơ bản
– Tiến hành chia ngõ vào thành 32 băng con bởi các băng lọc
• Lấy 32 mẫu PCM trong cùng một thời ñiểm, kết quả là 32 hệ số tần số ở ngõ ra. – Trong MPEG-1 lớp I thì tập 32 giá trị PCM ñược kết hợp vào trong khối gồm
12 nhóm 32 mẫu này
– MPEG-1 lớp II và lớp III thì gồm 3 khối 12 nhóm này
– Phân bố bit ñảm bảo rằng mọi nhiễu lượng tử nằm ở dưới các ngưỡng che – Với mỗi băng con, xác ñịnh mức biên ñộ và mức nhiễu bằng mô hình tâm sinh
lý nghe SMR (signal-mask rate) ñược sử dụng ñể xác ñịnh số bit cho quá trình lượng tử hoá ñối với mỗi băng con với mục ñích giảm thiểu dung lượng
Trang 2Ví dụ: Sau khi phân tích, mức của 16 băng con ñầu là:
Band 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Level (db) 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1
Nếu mức của băng con thứ 8 là 60 thì nó che 12 dB ở băng con thứ 7 và 15 dB ở băng con thứ 9
Băng con 7 có mức 10dB<12dB: loại Băng con 9 có mức 35dB>15dB: gởi ñi
Chỉ có các mức lớn hơn mức che là ñược gởi ñi thay vì dùng 6 bits ñể mã hoá, ta chỉ dùng 4 bits
MPEG-Layer I: Bộ lọc DCT 1 khung và tần số bằng phẳng trong mỗi băng con
Mô hình tâm sinh lý nghe sử dụng che tần số
MPEG-Layer II: Có 3 khung trong bộ lọc (trước, hiện tại và kế), tổng là 1125 mẫu Sử dụng vài bits ñể che thời gian
MPEG-Layer III: Sử dụng bộ lọc tới hạn ñể ñáp ứng tốt hơn Mô hình tâm sinh lý nghe sử dụng che thời gian, che tần số, tính toán ñộ dư thừa stereo và mã hoá Hufman
MPEG-1
• Cấu trúc khung
– Header Info: Gồm 12 bits ñồng bộ; 20 bis thông tin hệ thống chỉ thị tốc ñộ bit, tần số lấy mẫu, dạng nhấn…; 16 bits CRC với ña thức sinh x16+x15+x2+1
– Side Info: Gồm phân bố bit: lớp 1 với 4 bits tuyến tính cho các băng con, lớp
II 4 bits cho các băng con tần thấp, 3 bit tần trung và 2 bits tần cao; hệ số tỷ lệ
là 6 bits/băng con kết hợp với phân bố bits và các bits mã hóa cho băng con ñó
ñể xác ñịnh giá trị, lớp III mã hóa âm thanh nổi
– Subband Samples: 32x12 mẫu ñối với lớp I và 32x36 mẫu ñối với lớp II và lớp III
– Aux Data: Dữ liệu bổ sung
Header Info Side Info Subband Samples Aux Data
Trang 3• Mở rộng MPEG-1 cho các ứng dụng mới
• Cĩ khả năng áp dụng nhiều tốc độ khác nhau, từ 32 đến 1066kbps Tần số lấy mẫu
cĩ thể giảm 1 nửa so với MPEG-1 (16; 22,05; 24kHz)
• Khả năng đa kênh, tốc độ bits mở rộng cĩ thể lên đến 1 Mbps cho các ứng dụng tốc độ cao Cho phép nén đồng thời nhiều kênh
• Chất lượng âm thanh tuỳ thuộc ứng dụng
• Hỗ trợ khả năng lồng tiếng, bình luận nhiều ngơn ngữ trong phần bits mở rộng
• MPEG-2 sử dụng mã hố cường độ cao, giảm xuyên âm, mã hố dự đốn liên kênh và mã hố ảo ảnh kênh trung tâm để nhận được tốc độ bit kết hợp 384 kbps
• Khung MPEG-2 được chia thành 2 phần, phần đầu là MPEG-1stereo, phần mở rộng MPEG-2 chứa tất cả những dữ liệu surround khác
MPEG-2
Mono-stereo
MPEG-1
32;44.1;48kHz
MPEG-2
Layer I
Layer II
Layer III
Mono-stereo MPEG-2 16;22,05;24kHz
Layer I Layer II Layer III
5 channels MPEG-2 multi channel 32;44.1;48kHz
Layer I Layer II Layer III
Trang 4• Mã hoá và giải mã MPEG-2
Matrix
MPEG-1 encoder
MPEG-2 Extension encoder
L
C
R
LS
RS
L0 R0 T3 T4 T5
decoder
MPEG-2 Extension decoder
L0’
R0’
T3’
T4’
T5’
Inverse Matrix
L’
C’
R’
LS’
RS’
channel
MPEG-2
Trong ñó:
Với R: phải, L: trái, C: trung tâm, LS:trái vòm và RS: phải vòm
Từ ñó dễ dàng trong mã hóa thuận nghịch
Cấu trúc khung
=
=
=
=
= +
= +
+
=
+ +
=
0
; 1 2
1
; 2 1
1 ,
) (
0
) (
0
δ β α δ
β α
δ β α
δ β
α
or RS
C R R
LS C L L
MPEG1 header MPEG-1 Data MPEG-1 Auxillary Data
MPEG2 header MPEG2 Data Khung MPEG-1/2
Trang 5AC-3 (DOLBY DIGITAL)
• Chuyển tải âm thanh ña kênh trong các ứng dụng như DVD-Video, DTV và DBS
• Phát triển từ AC-1 và AC-2
• Mã hoá âm thanh từ 1 ñến 6 kênh, thông thường cung cấp âm thanh 5.1 kênh: trái, phải, trung tâm, trái vòm, phải vòm và 1 kênh hiệu ứng tần số thấp
• 6 kênh yêu cầu 6x48kHzx18bits=5.184Mbps chưa nén có thể ñược mã hoá tối thiểu với tốc ñộ 384kbps (tỷ lệ 13:1)
• Tuy nhiên, AC-3 hỗ trợ tốc ñộ từ 32 ñến 640kbps
• Cung cấp khả năng tự chọn mức âm thanh cho thính giả
• Cho phép giảm dữ liệu bằng quá trình lượng tử biểu diễn trong miền tần số của tín hiệu âm thanh
• Bộ mã hoá sử dụng băng lọc phân tích chuyển các mẫu PCM thành các hệ số trong miền tần số Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm phần số mũ và phần ñịnh trị Các tập số mũ ñược mã hoá thô qua phổ tín hiệu và xem như là ñường bao phổ Sử dụng phân phối bít xác ñịnh số bits cần mã hoá mỗi ñịnh trị dựa vào ñường bao phổ ðường bao phổ và các ñịnh trị ñược lượng tử cho 6 khối âm thanh (1536 mẫu âm thanh) ñược ñịnh dạng thành khung rồi chuyển ñi
AC-3 (DOLBY DIGITAL)
Quá trình giải mã hoàn toàn ngược lại, ở ñây chỉ xét quá trình mã hoá
Băng lọc phân tích
Mã hoá ñường bao Chỉ ñịnh bit
Lượng tử hoá phần ñịnh trị
ðịnh dạng khung AC-3
Thông tin chỉ ñịnh bit Phần ñịnh trị
Số mũ
ðường bao phổ ñược mã hoá
Phần ñịnh trị ñược lượng tử hoá
Các mẫu
PCM
Dòng bit AC-3
Trang 6• APT-X100 cho tỷ lệ nén 4:1
• Sử dụng để truyền dẫn, lưu trữ các tín hiệu audio mono, stereo hay đa kênh chất lượng cao
• Khơng hẳn dựa vào mơ hình tâm sinh lý nghe, cũng khơng trực tiếp loại các thành phần khơng thích hợp trong tín hiệu audio, mà nĩ ngầm hiểu một mơ hình đáp ứng nghe bằng việc phân phối ít bit ở tần số cao
• Thuật tốn hồn tồn trong miền thời gian sử dụng mã hố dự đốn tuyến tính trong các băng con
• Hoạt động với bất kỳ tần số lấy mẫu với ngõ ra 16 bits/từ mẫu
• Tín hiệu audio được chia thành 4 băng con với băng thơng đều nhau sử dụng các bộ lọc QMF
• Tín hiệu được phân tích trong miền thời gian: sử dụng mã hố dự đốn tuyến tính ADPCM để lượng tử mỗi băng theo nội dung và loại bỏ độ dư thừa trong các băng con
• Mã hố sự khác biệt của mẫu hiện thời và mẫu trước
• Giải mã được tiến hành một cách ngược lại
MÃ HĨA ÂM THANH NỔI
• Âm thanh đa kênh
C
C
S: Surround
LFE : Low Frequency Enhancement (Woofer)
15 – 120Hz
Cĩ thể đặt bất kỳ
3/2 3/2 với siêu trầm (5.1)
Trang 7MÃ HOÁ ÂM THANH NỔI
• Mã hóa Trái phải (LR)
Không loại bỏ ñộ dư thừa.
Các kênh riêng biệt ñược mã hoá ñộc lập.
Ngưỡng che không liên quan.
Hiệu quả với âm thanh rất khác biệt giữa kênh trái và kênh phải.
N1
N2
L≈R
R≈L
+
+
L’
R’
Nguồn
• Joint Stereo Midle-Side
Khuynh hướng của Joint Stereo không chỉ là kết hợp các ñịnh dạng của chuẩn nén mp3 (MPEG1 lớp III) mà còn kết hợp các dạng khác: MPEG và AAC
Middle-Side Stereo xét hai kênh dữ liệu theo hai phương diện khác nhau Thay vì lưu trữ một dữ liệu âm thanh theo hai kênh Left và Right, ta có thể chỉ cần lưu trữ một chuỗi tương tự số trung bình Average (của Left và Right) và sự sai biệt Difference (giữa Left và Right)
Ở dạng Middle-Side, ta có thể lưu trữ các giá trị Middle và Side như sau:
Middle=(L+R)/2, Side=(L-R)/2
Dấu của Side là rất quan trọng, nếu Side >0 nghĩa là tín hiệu L lớn hơn tín hiệu R
Ta hoàn toàn có thể tái tạo hai kênh L, R như sau:
L=Middle+Side, R=Middle-Side
Ưu ñiểm là sự khác biệt tương ñối của các tín hiệu audio của các kênh L và
R Kết quả là kênh Middle lớn hơn nhiều so với kênh Side Việc mã hoá kênh Side sử dụng ít bít hơn ñể giải phóng tài nguyên mà có thể ñược sử dụng ñể triển khai hữu hiệu hơn trên kênh Middle Khi tái ñịnh dạng lại L, R thì kết quả sẽ thể hiện tín hiệu gốc ngõ vào thực hơn
Trang 8MÃ HOÁ ÂM THANH NỔI
– Tính chất
Kênh side sử dụng số bit rất ít
Loại bỏ ñộ dư thừa cho tín hiệu mono trong thực tế
Có thể ñược áp dụng trong miền thời gian lẫn tần số
ðộ lợi mã hoá cao phụ thuộc tín hiệu
– Biến ñổi ngược: tổng/hiệu chuẩn hoá.
• Stereo ghép cường ñộ cao (Intensity Stereo):
Mục ñích: Tối thiểu hoá thông tin stereo ñể nhận ñược tốc ñộ bit thấp nhất nếu có thể
• Mã hoá tín hiệu tổng các kênh + các hướng của các kênh Truyền ñường bao, sau
ñó tỷ lệ theo các kênh
• Kiểm chứng dựa trên việc cảm nhận của con người kém ñối với tần số trên 3kHz
• Không liên quan ñến kỹ thuật suy giảm
• Biên ñộ và pha là không quan trọng
• Giảm gần 50% dữ liệu
• Không ñảm bảo thông tin về pha của tín hiệu
• Một vài sự méo có thể nhận biết ñược
• Sử dụng trong các ứng dụng tốc ñộ bit thấp
Trang 9MÃ HOÁ ÂM THANH NỔI
Chỉnh pha
Chỉnh pha
Σ
ðo biên ñộ
ðo biên ñộ
÷
÷
ðo biên ñộ ðo biên ñộ
Hướng kênh L Hướng kênh R
L+R L
R
X X
L+R
Hướng kênh L
Hướng kênh R
L R