1. Trang chủ
  2. » Công Nghệ Thông Tin

MULTIMEDIA phần 5 ppt

9 123 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Mpeg-1 – Kiến Trúc Băng Lọc Phân Tích Đa Pha 32 Kênh
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Công Nghệ Thông Tin
Thể loại Bài Tập Lớn
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 9
Dung lượng 420,17 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

SMR signal-mask rate ñược sử dụng ñể xác ñịnh số bit cho quá trình lượng tử hoá ñối với mỗi băng con với mục ñích giảm thiểu dung lượng... – Side Info: Gồm phân bố bit: lớp 1 với 4 bits

Trang 1

– Kiến trúc

Băng lọc phân tích ña pha 32 kênh

Lượng tử hoá

Mã hoá

M U X FFT

LI: 512 LII: 1024

Phân tích tâm sinh lý

âm học

Phân phối bit ñộng

32 Dữ liệu

Thông tin thêm SMR Lượng tử

32

Dữ liệu

SMR: Tỷ số tín

hiệu/ngưỡng che

Băng lọc phân tích ña

M U X

FFT

Phân tích tâm sinh lý

âm học

SMR

32

Vòng lặp chỉ ñịnh bit Lượng tử hoá

Mã hoá Huffman

Mã thông tin thêm

↓32

MPEG1 lớp 1,2

MPEG1 lớp 3

Thông tin thêm

MPEG-1

• Thuật toán cơ bản

– Tiến hành chia ngõ vào thành 32 băng con bởi các băng lọc

• Lấy 32 mẫu PCM trong cùng một thời ñiểm, kết quả là 32 hệ số tần số ở ngõ ra. – Trong MPEG-1 lớp I thì tập 32 giá trị PCM ñược kết hợp vào trong khối gồm

12 nhóm 32 mẫu này

– MPEG-1 lớp II và lớp III thì gồm 3 khối 12 nhóm này

– Phân bố bit ñảm bảo rằng mọi nhiễu lượng tử nằm ở dưới các ngưỡng che – Với mỗi băng con, xác ñịnh mức biên ñộ và mức nhiễu bằng mô hình tâm sinh

lý nghe SMR (signal-mask rate) ñược sử dụng ñể xác ñịnh số bit cho quá trình lượng tử hoá ñối với mỗi băng con với mục ñích giảm thiểu dung lượng

Trang 2

Ví dụ: Sau khi phân tích, mức của 16 băng con ñầu là:

Band 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Level (db) 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1

Nếu mức của băng con thứ 8 là 60 thì nó che 12 dB ở băng con thứ 7 và 15 dB ở băng con thứ 9

Băng con 7 có mức 10dB<12dB: loại Băng con 9 có mức 35dB>15dB: gởi ñi

 Chỉ có các mức lớn hơn mức che là ñược gởi ñi thay vì dùng 6 bits ñể mã hoá, ta chỉ dùng 4 bits

MPEG-Layer I: Bộ lọc DCT 1 khung và tần số bằng phẳng trong mỗi băng con

Mô hình tâm sinh lý nghe sử dụng che tần số

MPEG-Layer II: Có 3 khung trong bộ lọc (trước, hiện tại và kế), tổng là 1125 mẫu Sử dụng vài bits ñể che thời gian

MPEG-Layer III: Sử dụng bộ lọc tới hạn ñể ñáp ứng tốt hơn Mô hình tâm sinh lý nghe sử dụng che thời gian, che tần số, tính toán ñộ dư thừa stereo và mã hoá Hufman

MPEG-1

• Cấu trúc khung

– Header Info: Gồm 12 bits ñồng bộ; 20 bis thông tin hệ thống chỉ thị tốc ñộ bit, tần số lấy mẫu, dạng nhấn…; 16 bits CRC với ña thức sinh x16+x15+x2+1

– Side Info: Gồm phân bố bit: lớp 1 với 4 bits tuyến tính cho các băng con, lớp

II 4 bits cho các băng con tần thấp, 3 bit tần trung và 2 bits tần cao; hệ số tỷ lệ

là 6 bits/băng con kết hợp với phân bố bits và các bits mã hóa cho băng con ñó

ñể xác ñịnh giá trị, lớp III mã hóa âm thanh nổi

– Subband Samples: 32x12 mẫu ñối với lớp I và 32x36 mẫu ñối với lớp II và lớp III

– Aux Data: Dữ liệu bổ sung

Header Info Side Info Subband Samples Aux Data

Trang 3

• Mở rộng MPEG-1 cho các ứng dụng mới

• Cĩ khả năng áp dụng nhiều tốc độ khác nhau, từ 32 đến 1066kbps Tần số lấy mẫu

cĩ thể giảm 1 nửa so với MPEG-1 (16; 22,05; 24kHz)

• Khả năng đa kênh, tốc độ bits mở rộng cĩ thể lên đến 1 Mbps cho các ứng dụng tốc độ cao Cho phép nén đồng thời nhiều kênh

• Chất lượng âm thanh tuỳ thuộc ứng dụng

• Hỗ trợ khả năng lồng tiếng, bình luận nhiều ngơn ngữ trong phần bits mở rộng

• MPEG-2 sử dụng mã hố cường độ cao, giảm xuyên âm, mã hố dự đốn liên kênh và mã hố ảo ảnh kênh trung tâm để nhận được tốc độ bit kết hợp 384 kbps

• Khung MPEG-2 được chia thành 2 phần, phần đầu là MPEG-1stereo, phần mở rộng MPEG-2 chứa tất cả những dữ liệu surround khác

MPEG-2

Mono-stereo

MPEG-1

32;44.1;48kHz

MPEG-2

Layer I

Layer II

Layer III

Mono-stereo MPEG-2 16;22,05;24kHz

Layer I Layer II Layer III

5 channels MPEG-2 multi channel 32;44.1;48kHz

Layer I Layer II Layer III

Trang 4

• Mã hoá và giải mã MPEG-2

Matrix

MPEG-1 encoder

MPEG-2 Extension encoder

L

C

R

LS

RS

L0 R0 T3 T4 T5

decoder

MPEG-2 Extension decoder

L0’

R0’

T3’

T4’

T5’

Inverse Matrix

L’

C’

R’

LS’

RS’

channel

MPEG-2

Trong ñó:

Với R: phải, L: trái, C: trung tâm, LS:trái vòm và RS: phải vòm

Từ ñó dễ dàng trong mã hóa thuận nghịch

Cấu trúc khung

=

=

=

=

= +

= +

+

=

+ +

=

0

; 1 2

1

; 2 1

1 ,

) (

0

) (

0

δ β α δ

β α

δ β α

δ β

α

or RS

C R R

LS C L L

MPEG1 header MPEG-1 Data MPEG-1 Auxillary Data

MPEG2 header MPEG2 Data Khung MPEG-1/2

Trang 5

AC-3 (DOLBY DIGITAL)

• Chuyển tải âm thanh ña kênh trong các ứng dụng như DVD-Video, DTV và DBS

• Phát triển từ AC-1 và AC-2

• Mã hoá âm thanh từ 1 ñến 6 kênh, thông thường cung cấp âm thanh 5.1 kênh: trái, phải, trung tâm, trái vòm, phải vòm và 1 kênh hiệu ứng tần số thấp

• 6 kênh yêu cầu 6x48kHzx18bits=5.184Mbps chưa nén có thể ñược mã hoá tối thiểu với tốc ñộ 384kbps (tỷ lệ 13:1)

• Tuy nhiên, AC-3 hỗ trợ tốc ñộ từ 32 ñến 640kbps

• Cung cấp khả năng tự chọn mức âm thanh cho thính giả

• Cho phép giảm dữ liệu bằng quá trình lượng tử biểu diễn trong miền tần số của tín hiệu âm thanh

• Bộ mã hoá sử dụng băng lọc phân tích chuyển các mẫu PCM thành các hệ số trong miền tần số Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm phần số mũ và phần ñịnh trị Các tập số mũ ñược mã hoá thô qua phổ tín hiệu và xem như là ñường bao phổ Sử dụng phân phối bít xác ñịnh số bits cần mã hoá mỗi ñịnh trị dựa vào ñường bao phổ ðường bao phổ và các ñịnh trị ñược lượng tử cho 6 khối âm thanh (1536 mẫu âm thanh) ñược ñịnh dạng thành khung rồi chuyển ñi

AC-3 (DOLBY DIGITAL)

Quá trình giải mã hoàn toàn ngược lại, ở ñây chỉ xét quá trình mã hoá

Băng lọc phân tích

Mã hoá ñường bao Chỉ ñịnh bit

Lượng tử hoá phần ñịnh trị

ðịnh dạng khung AC-3

Thông tin chỉ ñịnh bit Phần ñịnh trị

Số mũ

ðường bao phổ ñược mã hoá

Phần ñịnh trị ñược lượng tử hoá

Các mẫu

PCM

Dòng bit AC-3

Trang 6

• APT-X100 cho tỷ lệ nén 4:1

• Sử dụng để truyền dẫn, lưu trữ các tín hiệu audio mono, stereo hay đa kênh chất lượng cao

• Khơng hẳn dựa vào mơ hình tâm sinh lý nghe, cũng khơng trực tiếp loại các thành phần khơng thích hợp trong tín hiệu audio, mà nĩ ngầm hiểu một mơ hình đáp ứng nghe bằng việc phân phối ít bit ở tần số cao

• Thuật tốn hồn tồn trong miền thời gian sử dụng mã hố dự đốn tuyến tính trong các băng con

• Hoạt động với bất kỳ tần số lấy mẫu với ngõ ra 16 bits/từ mẫu

• Tín hiệu audio được chia thành 4 băng con với băng thơng đều nhau sử dụng các bộ lọc QMF

• Tín hiệu được phân tích trong miền thời gian: sử dụng mã hố dự đốn tuyến tính ADPCM để lượng tử mỗi băng theo nội dung và loại bỏ độ dư thừa trong các băng con

• Mã hố sự khác biệt của mẫu hiện thời và mẫu trước

• Giải mã được tiến hành một cách ngược lại

MÃ HĨA ÂM THANH NỔI

• Âm thanh đa kênh

C

C

S: Surround

LFE : Low Frequency Enhancement (Woofer)

15 – 120Hz

Cĩ thể đặt bất kỳ

3/2 3/2 với siêu trầm (5.1)

Trang 7

MÃ HOÁ ÂM THANH NỔI

• Mã hóa Trái phải (LR)

Không loại bỏ ñộ dư thừa.

Các kênh riêng biệt ñược mã hoá ñộc lập.

Ngưỡng che không liên quan.

Hiệu quả với âm thanh rất khác biệt giữa kênh trái và kênh phải.

N1

N2

L≈R

R≈L

+

+

L’

R’

Nguồn

• Joint Stereo Midle-Side

Khuynh hướng của Joint Stereo không chỉ là kết hợp các ñịnh dạng của chuẩn nén mp3 (MPEG1 lớp III) mà còn kết hợp các dạng khác: MPEG và AAC

Middle-Side Stereo xét hai kênh dữ liệu theo hai phương diện khác nhau Thay vì lưu trữ một dữ liệu âm thanh theo hai kênh Left và Right, ta có thể chỉ cần lưu trữ một chuỗi tương tự số trung bình Average (của Left và Right) và sự sai biệt Difference (giữa Left và Right)

Ở dạng Middle-Side, ta có thể lưu trữ các giá trị Middle và Side như sau:

Middle=(L+R)/2, Side=(L-R)/2

Dấu của Side là rất quan trọng, nếu Side >0 nghĩa là tín hiệu L lớn hơn tín hiệu R

Ta hoàn toàn có thể tái tạo hai kênh L, R như sau:

L=Middle+Side, R=Middle-Side

Ưu ñiểm là sự khác biệt tương ñối của các tín hiệu audio của các kênh L và

R Kết quả là kênh Middle lớn hơn nhiều so với kênh Side Việc mã hoá kênh Side sử dụng ít bít hơn ñể giải phóng tài nguyên mà có thể ñược sử dụng ñể triển khai hữu hiệu hơn trên kênh Middle Khi tái ñịnh dạng lại L, R thì kết quả sẽ thể hiện tín hiệu gốc ngõ vào thực hơn

Trang 8

MÃ HOÁ ÂM THANH NỔI

– Tính chất

Kênh side sử dụng số bit rất ít

Loại bỏ ñộ dư thừa cho tín hiệu mono trong thực tế

Có thể ñược áp dụng trong miền thời gian lẫn tần số

ðộ lợi mã hoá cao phụ thuộc tín hiệu

– Biến ñổi ngược: tổng/hiệu chuẩn hoá.

• Stereo ghép cường ñộ cao (Intensity Stereo):

Mục ñích: Tối thiểu hoá thông tin stereo ñể nhận ñược tốc ñộ bit thấp nhất nếu có thể

• Mã hoá tín hiệu tổng các kênh + các hướng của các kênh Truyền ñường bao, sau

ñó tỷ lệ theo các kênh

• Kiểm chứng dựa trên việc cảm nhận của con người kém ñối với tần số trên 3kHz

• Không liên quan ñến kỹ thuật suy giảm

• Biên ñộ và pha là không quan trọng

• Giảm gần 50% dữ liệu

• Không ñảm bảo thông tin về pha của tín hiệu

• Một vài sự méo có thể nhận biết ñược

• Sử dụng trong các ứng dụng tốc ñộ bit thấp

Trang 9

MÃ HOÁ ÂM THANH NỔI

Chỉnh pha

Chỉnh pha

Σ

ðo biên ñộ

ðo biên ñộ

÷

÷

ðo biên ñộ ðo biên ñộ

Hướng kênh L Hướng kênh R

L+R L

R

X X

L+R

Hướng kênh L

Hướng kênh R

L R

Ngày đăng: 07/08/2014, 21:20

TỪ KHÓA LIÊN QUAN