CÔNG NGHỆ THÔNG TIN - MÃ HÓA HÌNH ẢNH ĐỘNG VÀ ÂM THANH KẾT HỢP CHO PHƯƠNG TIỆN LƯU TRỮ SỐ LÊN TỚI 1,5 MBIT/S - PHẦN 3: ÂM THANH

3.1.27 Các thông số mã hóa [video] coding parameters [video] Tập hợp các thông số do người dùng định nghĩa trình diễn cho một dòng bít trong đoạn video được mãhóa.. 3.1.84 Lớp [video v

Trang 1

TCVN T I Ê U C H U Ẩ N Q U Ố C G I A

TCVN XXXX : 201x ISO/IEC 11172 - 3: 1996

Xuất bản lần 1

CÔNG NGHỆ THÔNG TIN - MÃ HÓA HÌNH ẢNH ĐỘNG VÀ

ÂM THANH KẾT HỢP CHO PHƯƠNG TIỆN LƯU TRỮ SỐ

LÊN TỚI 1,5 MBIT/S - PHẦN 3: ÂM THANH

Information technology - Coding of moving pictures and associated audio for digital storage

media at up to about 1,5 Mbit/s Part 3: Audio

HÀ NỘI – 201x

Trang 3

1 Phạm vi áp dụng 7

2 Tài liệu viện dẫn 7

3 Thuật ngữ và định nghĩa 8

3.1 Định nghĩa 8

4 Ký hiệu và thuật ngữ viết tắt 23 4.1 Toán tử số học 23

4.2 Các toán tử logic 24

4.3 Các toán tử quan hệ 24

4.4 Các phép toán thao tác bít 24

4.5 Phép gán 24

4.6 Phép nhớ 24

4.7 Hằng số 25

5 Phương pháp mô tả cú pháp dòng bít 25 6 Các yêu cầu của cấu trúc mã hóa và tham số 26 6.1 Hàm chuỗi âm thanh 26

6.2 Hàm khung âm thanh 26

6.3 Hàm tiêu đề 26

6.4 Hàm kiểm tra lỗi 27

6.5 Hàm dữ liệu âm thanh, lớp I 27

6.6 Hàm dữ liệu âm thanh, lớp II 27

6.7 Hàm dữ liệu âm thanh lớp III 28

6.8 Hàm dữ liệu phụ trợ 31

7 Ngữ nghĩa cho cú pháp dòng bít âm thanh 31 7.1 Chuỗi âm thanh chung 31

7.2 Khung âm thanh 31

7.3 Tiêu đề 31

7.4 Kiểm tra lỗi 34

7.5 Dữ liệu âm thanh, lớp I 34

7.6 Dữ liệu âm thanh lớp II 35

7.7 Dữ liệu âm thanh, lớp III 35

7.8 Dữ liệu phụ trợ 41

8 Quá trình giải mã âm thanh 41 8.1 Tổng quan 41

8.2 Lớp I 42

8.2.1 Tái lượng tử hóa các mẫu băng tần con 42 8.2.2 Bộ lọc băng tần con tổng hợp 42 8.3 Lớp II 43 8.3.1 Giải mã phân bổ bit 43

8.3.2 Giải mã thông tin lựa chọn hệ số tỷ lệ 43

Trang 4

8.3.4 Tái lượng tử các mẫu băng tần con 43

8.3.5 Bộ lọc băng tần tổng hợp 44

8.4 Lớp III 44 8.4.1 Giải mã 45

8.4.10 Quá trình xử lý âm thanh nổi 46

Phụ lục A (Quy định) Sơ đồ mã hóa, giải mã 50

Trang 5

Thư mục tài liệu tham khảo151

Trang 6

TCVN xxxx: 201x được xây dựng trên cơ sở chấp nhận nguyên vẹn tiêu chuẩnISO/IEC 11172 - 3: 1996 Information technology - Coding of moving pictures andassociated audio for digital storage media at up to about 1,5 Mbit/s Part 3: Audio củaLiên minh Viễn thông Quốc tế.

TCVN xxxx : 201x do Viện Khoa học kỹ thuật Bưu điện - Học viện Công nghệ Bưuchính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêuchuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố

Trang 7

Công nghệ thông tin - Mã hóa hình ảnh động và âm thanh kết hợp cho phương tiện lưu trữ số lên tới 1,5 Mbit/s - Phần 3: Âm thanh.

Information technology - Coding of moving pictures and associated audio for digital storage media at up

to about 1,5 Mbit/s Part 3: Audio.

1 Phạm vi áp dụng

Tiêu chuẩn này quy định phương pháp mã hóa, giải mã tín hiệu âm thanh chất lượng cao Tín hiệu đầuvào của bộ mã hóa và đầu ra của bộ giải mã tương thích với các tiêu chuẩn PCM hiện tại như chuẩn đĩaquang (CD) và băng từ âm thanh số (Digital Audio Tape)

Tiêu chuẩn này áp dụng cho các thiết bị lưu trữ số trong việc tạo ra được dòng bít cả âm thanh và videovới tốc độ truyền liên tục lên tới 1,5 Mbit/s, chẳng hạn như CD, DAT và đĩa cứng từ (Hard disk) Cácthiết bị lưu trữ được kết nối trực tiếp với bộ giải mã, hoặc kết nối thông qua cả các phương tiện khácnhư đường truyền thông và dòng tín hiệu ISO/IEC 11172 đã ghép kênh được quy định trong phần 1 củatiêu chuẩn ISO/IEC 11172 Tiêu chuẩn này được xây dựng cho thực hiện mã hóa tại tốc độ lấy mẫu tần

số 32 kHz; 44,1 kHz và 48 kHz

2 Tài liệu viện dẫn

Tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này Đối với các tài liệu viện dẫn ghi nămcông bố thì áp dụng phiên bản được nêu Đối với các tài liệu viện dẫn không ghi năm công bố thì ápdụng phiên bản mới nhất, bao gồm cả sửa đổi, bổ sung (nếu có)

ISO/IEC 11172-1:1993 Information technology - Coding of moving pictures and associated audio for

digital storage media at up to about 1,5 Mbit/s Part 1: System (Công nghệ thông tin - Mã hóa hình ảnh

động và âm thanh kết hợp cho phương tiện lưu trữ số lên tới 1,5 Mbit/s - Phần 1: Hệ thống).

ISO/IEC 11172-1:1993 Information technology - Coding of moving pictures and associated audio for

digital storage media at up to about 1,5 Mbit/s - Part 2: Video (Công nghệ thông tin - Mã hóa hình ảnh

động và âm thanh kết hợp cho phương tiện lưu trữ số lên tới 1,5 Mbit/s - Phần 2: Video).

CCIR Recommendation 601-2 Encoding parameters of digital television for studios (Khuyến nghị CCIR

601-2 Các thông số mã hóa truyền hình số cho phòng thu).

CCIR Report 624-4 Characteristics of systems for monochrome and colour television (Báo cáo CCIR

624-4 Các đặc tính của hệ thống cho truyền hình màu và đơn sắc).

CCIR Recommendation 648 Recoding of audio signals (Khuyến nghị CCIR 648 Ghi tín hiệu âm thanh).

CCIR Report 955-2 Sound broadcasting by satellite for portable and mobile receivers, including Annex

IV Summry description of Advanced Digital System II (Báo cáo CCIR 955-2 Phát thanh quảng bá qua

vệ tinh cho các máy cầm tay và các bộ thu di động, bao gồm Phụ lục IV Mô tả khái quát về Hệ thống số cải tiến II).

CCIIT Recommendation J 17 Pre-emphasis used on Sound-Programme Circuits (Khuyến nghị CCIIT

J.17 Kỹ thuật tăng chỉnh được sử dụng trong các mạch chương trình âm thanh).

IEEE Draft Standard PllWD2 1990 Specification for the implementation of 8x 8 inverse discrete cosine

transform” (Dự thảo chuẩn IEEE PIIWD2 1990 Kỹ thuật cho việc thực hiện chuyển đổi Cosin rời rạc

ngược 8x8).

IEC publication 908:1987 CD Digital Audio System (IEC 908:1987 Hệ thống âm thanh số CD).

Trang 8

3 Thuật ngữ và định nghĩa

3.1 Định nghĩa

3.1.1

Hệ số AC [video] (AC coefficient [video])

Bất kỳ hệ số DCT mà có tần số trong một hoặc cả hai chiều có giá trị khác không

3.1.2

Đơn vị truy cập [hệ thống] (access unit [system])

Trong trường hợp âm thanh đã nén của một đơn vị truy cập là âm thanh Trong trường hợp video đãnén của một đơn vị truy cập là trình diễn đã mã hóa cho một hình ảnh

3.1.3

Phân đoạn thích nghi [âm thanh] (Adaptive segmentation [audio])

Việc phân nhỏ trong việc trình diễn kỹ thuật số của tín hiệu âm thanh trong việc phân đoạn thay đổi theothời gian

3.1.4

Phân bổ bít thích nghi [âm thanh] (adaptive bít allocation [audio])

Việc sắp xếp các bít vào các băng tần con theo thời gian và theo tần số thay đổi kiểu cách theo một môhình tâm thính học

3.1.5

Phân bổ nhiễu thích nghi [âm thanh] (adaptive noise allocation [audio])

Việc sắp xếp các nhiễu mã hóa vào các băng tần theo thời gian và tần số thay đổi kiểu cách theo một

mô hình tâm thính học

3.1.6

Bí danh Alias [âm thanh] [audio]

Một thành phần tín hiệu được phản chiếu từ việc lấy mẫu Nyquist

3.1.7

Phân tích băng lọc [âm thanh] (Analysis filter bank [audio])

Băng lọc trong bộ mã hóa chuyển đổi một tín hiệu âm thanh PCM băng thông rộng sang một tập cácmẫu băng con đã lấy mẫu

3.1.8

Đơn vị truy cập âm thanh [âm thanh] (Audio Access Unit [audio])

Với Lớp I và II, một đơn vị truy cập âm thanh được xác định như là một phần nhỏ nhất của dòng bít đã

mã hóa mà có thể được giải mẫ bởi chính nó, nghĩa là “ âm thanh được tái tạo hoàn toàn” Đỗi với LớpIII, một đơn vị truy cập âm thanh là một phần của dòng bít mà có thể được giải mã với việc sử dụngthông tin chính đã yêu cầu trước đó

3.1.9

Bộ đệm âm thanh [âm thanh] (audio buffer [audio])

Trang 9

Một bộ đệm trong các bộ giải mã hệ thống chính cho lưu trữ âm thanh nén

3.1.10

Chuỗi âm thanh [âm thanh] (audio sequence [audio])

Một loạt các khung âm thanh không bị gián đoạn trong đó các tham số sau đây không thay đổi:

Véc tơ chuyển động ngược [video] (backward motion vector [video])

Một véc tơ chuyển động được sử dụng để bù chuyển động từ một hình ảnh tham chiếu tại một thời điểmsau đó trong thứ tự hiển thị

3.1.12

Bark [âm thanh] [audio]

Đơn vị đo tốc độ dải tới hạn Thang đo Bark là việc ánh xạ không tuyến tính với thang đo tần số trên dải

âm thanh gần tương ứng với lựa chọn tần số của tai con người trên dải

3.1.13

Hình ảnh đã mã hóa tiên đoán hai chiều; ảnh B [video] (B-picture)

Một hình ảnh được mã hóa sử dụng bù chuyển động dự đoán một hình ảnh từ trước hoặc sau

3.1.14

Tốc độ bít (bitrate)

Tốc độ mà dòng bít bị nén được phân phối từ các phương tiện lưu trữ tới đầu vào của một bộ giải mã

3.1.15

Khối nén giãn [âm thanh] (Block companding [audio])

Tiêu chuẩn hóa việc trình diễn kỹ thuật số tín hiệu âm thanh trong một khoảng thời gian nhất định

3.1.16

Khối [video] (block [video])

là một khối gồm 8 hàng và 8 cột

3.1.17

Phạm vi [âm thanh] (Bound [audio])

Các băng tần con thấp nhất trong đó cường độ âm thanh stereo mã hóa được sử dụng

3.1.18

Căn chỉnh byte (byte aligned)

Vị trí trong dòng bít cách bít đầu tiên của dòng mã n byte (8 bít), với n là số nguyên dương

Trang 10

Màu (thành phần) [video]: Một ma trận, khối hoặc một pixel đơn lẻ trình diễn một trong hai tín hiệu màu

sắc khác nhau liên quan đến các màu cơ bản theo định nghĩa được quy định trong CCIR rec 601 Các

ký hiệu sử dụng cho tín hiệu màu sắc khác nhau là Cr và Cb

3.1.23

Dòng bít mã hóa âm thanh [âm thanh] (coded audio bitstream [audio])

Việc trình diễn mã hóa của tín hiệu âm thanh được định nghĩa theo tiêu chuẩn ISO/IEC 11172

3.1.24

Dòng bít mã hóa video [video] (coded video bitstream [video])

Việc trình diễn mã hóa của một chuỗi của một hoặc nhiều hình ảnh theo tiêu chuẩn ISO/IEC 11172

3.1.25

Thứ tự mã hóa [video] (coded oder [video])

Thứ tự mã hóa mà các hình ảnh được lưu trữ hoặc giải mã Thứ tự này không nhất thiết giống nhaunhư được hiển thị

3.1.26

Trình diễn mã hóa (coded representation)

Thành phần dữ liệu như được trình diễn trong định dạng mã hóa của nó

3.1.27

Các thông số mã hóa [video] (coding parameters [video])

Tập hợp các thông số do người dùng định nghĩa trình diễn cho một dòng bít trong đoạn video được mãhóa Dòng bít là đặc trưng bởi các thông số mã hóa Bộ giải mã dược đặc trưng bởi khả năng giải mãcủa các dòng bít

3.1.28

Thành phần màu [video] (component [video])

Một ma trận, khối hoặc mẫu dữ liệu pixel từ một trong 3 ma trận (độ chói và 2 độ màu) để tạo nên mộtbức ảnh

3.1.29

Nén (compression)

Trang 11

Kỹ thuật làm giảm số lượng các bít được sử dụng để trình diễn với một mục của dữ liệu

3.1.30

Hằng số bitrate mã hoá video [video] (constant bitrate coded video[video])

Một dòng video đã nén với hằng số tốc độ bít trung bình

3.1.31

Hằng số bitrate (constant bitrate)

Hoạt động mà tốc độ bít là không đổi từ lúc bắt đầu tới lúc kết thúc nén của dòng bít

3.1.32

Các thông số bắt buộc [video] (constrained parameters[video])

Trong trường hợp các đặc điểm kỹ thuật video, các giá trị của một tập các thiết lập thông số mã hóađược quy định tại khoản 2.4.3.2 của tiêu chuẩn ISO/IEC 11172-2

3.1.33

Dòng thông số hệ thống bắt buộc [hệ thống] - constrained system parameter stream (CSPS)

Một dòng tín hiệu tiêu chuẩn ISO/IEC 11172 đã ghép kênh mà phải bắt buộc theo quy định tại khoản2.4.6 tiêu chuẩn ISO/IEC 11172-1

3.1.34

CRC

Mã kiểm tra độ dư vòng

3.1.35

Tốc độ băng tới hạn [âm thanh] (critical band rate [audio])

Chức năng tâm thính học của tần số Tại tần số âm học cho trước là tương ứng với số băng tới hạnphía dưới tần số đó Đơn vị của tốc độ băng tới hạn là Bark

3.1.36

Băng tới hạn [âm thanh] (critical band [audio])

Đo lường tâm thính học trọng miền phổ mà tương ứng với tần số lựa chọn của tai con người Việc lựachọn này được diễn tả theo đơn vị Bark

3.1.37

Phần tử dữ liệu (data element)

Một mục dữ liệu được trình diễn trước khi mã hóa và sau khi giải mã

3.1.38

Hệ số DC [video] (DC-coefficient)

Hệ số biến đổi Cosine rời rạc DCT mà tần số bằng không trong cả hai chiều

3.1.39

Hình ảnh mã hóa DC; ảnh D [video] (DC – coded picture; D – picture [video])

Một bức ảnh được mã hóa chỉ sử dụng thông tin từ chính nó Trong các hệ số DCT trình diễn mã hóa,chỉ có hệ số DC được biểu thị

Trang 12

3.1.40

Hệ số biến đổi cosin rời rạc DCT (DCT coefficient [video])

Biên độ của hàm cosin cụ thể

3.1.41

Dòng giải mã (decoded stream)

Quá trình giải mã được khôi phục từ một dòng bít nén

3.1.42

Bộ đệm đầu vào bộ giải mã [video] (decoder input buffer [video])

Bộ đệm kiểu vào trước ra trước (FIFO) được xác thực trong bộ đệm video

3.1.43

Tốc độ đầu vào bộ giải mã [video] (decoder input rate [video])

Tốc độ dữ liệu quy đinh xác minh trong bộ đệm video và mã hóa trong dòng bít của video

3.1.44

Bộ giải mã (decoder)

là hiện thân của quá trình giải mã

3.1.45

Quá trình giải mã (decoding process)

Quá trình được xác định trong tiêu chuẩn ISO/IEC 11172 mà đầu vào là toàn bộ hoặc một phần của mộtdòng mã và kết quả đầu ra là toàn bộ hoặc một phần hình ảnh đầu ra hoặc âm thanh đã lấy mẫu

3.1.46

Nhãn thời gian giải mã DTS [hệ thống] (decoding time-stamp; DTS [system])

Chỉ báo thời gian giải mã danh định của một đơn vị truy cập

3.1.47

Mạch giảm âm [âm thanh] (De-emphasis [audio])

Quá trình lọc được áp dụng cho tín hiệu âm thanh sau khi lưu trữ hoặc truyền tải để hoàn tác một biếndạng tuyến tính làm giảm âm

3.1.48

Tái lượng tử [video] (dequantization [video])

Quá trình biến đổi lại thang tỷ lệ của các hệ số DCT đã định lượng sau khi trình diễn chúng dưới dạngdòng bít đã giải mã và trước khi thực hiện biến đổi DCT nghịch đảo

3.1.49

Phương tiện lưu trữ kỹ thuật số; DSM (digital storage media; DSM)

Một thiết bị lưu trữ, thiết bị truyền hay hệ thống kỹ thuật số

3.1.50

Biến đổi cosin rời rạc DCT [video] (discrete cosine transform; DCT [video])

Trang 13

Là biến đổi cosin rời rạc thuận hoặc cosin rời rạc nghịch đảo DCT là một sự chuyển đổi trực giao có thểđảo ngược, rời rạc DCT nghịch đảo được định nghĩa trong phụ lục A của ISO/IEC 11172-2

3.1.51

Thứ tự hiển thị [video] (display order [video])

Thứ tự các hình ảnh được giải mã sẽ được hiển thị Thông thường thứ tự này giống như trình diễn đầuvào của bộ mã hóa

3.1.52

Chế độ song kênh [âm thanh] (dual channel mode [audio])

Một chế độ mà hai kênh âm thanh hoạt động với hai chương trình độc lập như nhau (ví dụ: song ngữ)cho quá trình giải mã trong một dòng bít Qúa trình mã hoá giống như là chế độ stereo

Dòng cơ sở [hệ thống] (elementary stream [system])

là một thuật ngữ chung cho một mã hóa video, mã hóa âm thanh hoặc mã hóa dòng bít khác

3.1.55

Mạch tăng âm [âm thanh] (Emphasis [audio])

Quá trình lọc được áp dụng cho tín hiệu âm thanh sau khi lưu trữ hoặc truyền tải nhằm nâng cao tỷ sốtín hiệu trên nhiễu ở tần số cao

3.1.56

Bộ mã hóa (encoder)

Một biểu trưng của quá trình mã hóa

3.1.57

Quá trình mã hóa (encoding process)

Một quá trình, không quy định trong tiêu chuẩn này, nó được hiểu là một chuỗi của hình ảnh đầu vào và

âm thanh lấy mẫu tạo ra một dòng bít được mã hóa theo như định nghĩa ghi trong tiêu chuẩn này

3.1.58

Mã hóa entropy (entropy coding)

Kỹ thuật mã hóa thông tin có mất mát có độ dài thay đổi, kỹ thuật Entropy mã hoá để tối thiểu hoá lượngtin quan trọng cần giữ lại

3.1.59

Tua nhanh, tuy chậm [video] (fast forward playback [video])

Quá trình hiển thị liên tục, hoặc một phần của một chuỗi hình ảnh đoạn video xuôi, ngược nhanh hơn sovới thời gian thực

Trang 14

Băng lọc [âm thanh] (Filter bank [audio])

Một tập hợp các bộ lọc thông qua bao trọn toàn bộ giải tần âm thanh

3.1.62

Phân đoạn cố định (Fixed segmentation)

Một phần trình diễn tín hiệu âm thanh vào trong các phân đoạn thời gian cố định

Cập nhật bắt buộc [video] (forced updating [video])

Quá trình mà khối macro ở trong mã hóa theo dạng thời gian - thời gian để đảm bảo rằng không phátsinh lỗi trong quá trình biến đổi DCT trong các bộ mã hóa và bộ giải mã hóa mà không bị quá mức

3.1.65

Vector chuyển động thuận [video] (forward motion vector [video])

Một vector chuyển động được sử dụng để bù chuyển động từ một hình ảnh mẫu tại thời điểm trước theothứ tự hiển thị

3.1.66

Khung [âm thanh] (frame [audio])

Một phần của tín hiệu âm thanh tương ứng với các mẫu âm thanh PCM từ bộ truy cập âm thanh

3.1.67

Định dạng tự do [âm thanh] (Free format [audio])

Bất kỳ tốc độ bít nào khác hơn tốc độ bít cố định đều phải có giá trị nhỏ hơn tốc độ bít lớn nhất trongmỗi lớp

3.1.68

Dự đoán hình ảnh mẫu [video] (furure reference picture [video])

Hình ảnh mẫu này là hình ảnh tham khảo xảy ra tại một thời điểm muộn hơn hình ảnh hiện tại theo thứ

tự hiển thị

3.1.69

Hạt nhỏ [lớp II] [âm thanh] (granules [layer II] [audio])

Trang 15

Một tập 3 mẫu băng con liên tiếp từ tất cả 32 băng con mà đi cùng nhau trước khi lượng tử Chúngtương ứng với 96 mẫu PCM

3.1.70

Hạt nhỏ [lớp III] [âm thanh] (granules [layer III] [audio])

567 đường tần số mang thông tin khác nhau

3.1.71

Nhóm các hình ảnh [video] (group of pictures [video])

Một loạt của một hoặc nhiều hình ảnh nhằm hỗ trợ truy cập ngẫu nhiên Nhóm ảnh là một lớp trongbước mã hóa được định nghĩa trong phần 2 của tiêu chuẩn này

3.1.72

Cửa sổ Hann [âm thanh] (Hann window [audio])

Hàm thời gian được ứng dụng từng mẫu tới một khối mẫu âm thanh trước khi thực hiện biến đổiFourier

3.1.73

Mã hóa Huffman (Huffman coding)

Một phương pháp cụ thể của mã hóa entropy

3.1.74

Băng lọc âm thanh lai [âm thanh] (Hybrid filter bank [audio])

Một chuỗi kết hợp của các băng lọc con và bộ chuyển đổi cosin rời rạc biến đổi MDCT

3.1.75

IMDCT [âm thanh] (IDMCT [audio])

Biến đổi cosin rời rạc biến đổi nghịch đảo

3.1.76

Kỹ thuật Cường độ âm thanh stereo [âm thanh] (intensity stereo [audio])

Một phương pháp vận dụng lượng phân bố và tính dư thừa trong âm thanh nổi, các chương trình xử lý

âm thanh dựa vào việc duy trì tần số cao duy nhất bao quanh cho năng lượng kênh phải và kênh trái

3.1.77

Đan xen [video] (interlace [video])

Thuộc tính của hình ảnh truyền hình thông thường là các dòng hình ảnh được trình diễn liên tục đan xentrong khoảng thời gian khác nhau

3.1.78

Mã hóa intra [video] (intra coding [video])

Mã hóa nén của một khối hoặc hình ảnh có sử dụng thông tin từ chính khối hoặc hình ảnh đó

3.1.79

Hình ảnh mã hóa intra; ảnh I [Video]

Một hình ảnh mã hóa sử dụng thông tin từ chính nó

Trang 16

3.1.80

Dòng ISO/IEC 11172 đã ghép kênh (ISO/IEC 11172 (multiplexed) stream [system])

Một dòng bít gồm có 0 hoặc nhiều dòng bít thành phần kết hợp theo tiêu chuẩn ISO/IEC 11172

3.1.81

Phương pháp ghép nối mã hóa âm thanh nổi [âm thanh] (Joint stereo coding [audio])

Phương pháp mã hóa tận dụng đặc tính bất thường hay phần thừa âm thanh nổi

3.1.82

Chế độ ghép nối âm thanh nổi [âm thanh] (Joint stereo mode [audio])

Một chế độ của âm thanh sử dụng thuật toán mã hóa cho phần âm thanh nổi

3.1.83

Lớp [âm thanh] (layer [audio])

Một trong những cấp độ trong hệ thống âm thanh được xác định trong tiêu chuẩn ISO/IEC 11172

3.1.84

Lớp [video và hệ thống] (layer [video and systems])

Một trong những cấp độ hệ thống phân cấp dữ liệu của các thông số kỹ thuật video và hệ thống quyđịnh tại phần 1 và 2 của tiêu chuẩn ISO/IEC 11172

3.1.85

Độ chói (thành phần) (luminance (component))

Một ma trận, khối hoặc mẫu pixel trình diễn cho một tín hiệu đơn sắc và liên quan đến các mà cơ bảntheo định nghĩa của CCIR rec 601 Ký hiệu sử dụng cho độ chói là Y

3.1.86

Khối Macro

Bốn khối 8x8 của dữ liệu độ chói và tương ứng với hai khối kích thước 8x8 tương ứng độ màu tạo bởi

từ khối phần 16x16 thành phần độ sáng của hình ảnh Khối macro thường được dùng để chỉ các dữ liệupixel và được sử dụng cho các giá trị mã pixel và các thành phần dữ liệu khác được xác định trong lớpkhối macro được định nghĩa trong phần 2 của tiêu chuẩn này

3.1.87

Ánh xạ [âm thanh] (Mapping [audio])

Chuyển đổi tín hiệu âm thanh từ miền thời gian sang miền tần số bằng cách sử dụng bộ lọc băng convà/hoặc bằng phép biến đổi cosin rời rạc hiệu chỉnh MDCT

3.1.88

Mặt nạ (Masking)

Một đặc tính của hệ thống thính giác của con người không thể nhận thức được sự hiện diện của một tínhiệu âm thanh khác

Trang 17

3.1.89

Ngưỡng mặt nạ [âm thanh] (Masking threshold [audio])

Phần phía dưới của hàm trong miền tần số và thời gian mà tín hiệu âm thanh không thể được cảm nhậnbằng hệ thống thính giác của con người

3.1.90

MDCT [âm thanh] (MDCT [audio])

Biến đổi cosin rời rạc hiệu chỉnh

3.1.91

Bù chuyển động [video ] (motion compensation [video])

Việc sử dụng một vector chuyển động để nâng cao hiệu quả của các dự đoán kết quả các giá trị pixel.Các dự đoán sử dụng các vector chuyển động để cung cấp bù lại các khung trong quá khứ hoặc tươnglai đã truyền tải khi giải mã các pixel được sử dụng để tạo thành dự đoán

3.1.92

Ước lượng chuyển động [video] (motion estimation [video])

Quá trình ước lượng vector chuyển động trong suốt quá trình mã hóa

3.1.93

Vector chuyển động [video] (motion vector [video])

Một vector hai chiều sử dụng để bù chuyển động cung cấp tọa độ vị trí trong hình ảnh hiện tại đến tọa

độ vị trí trong một hình ảnh tham chiếu

3.1.94

Âm thanh nổi MS [âm thanh] (MS stereo [audio])

Một phương pháp khai thác tính năng khác nhau, phần thừa của âm thanh nổi trong các chương trình

âm thanh nổi dựa trên việc mã hóa tín hiệu tổng, tín hiệu sai khác thay vì mã hóa các kênh âm thanhtrái, phải Phương pháp sử dụng hai microphone khác nhau và một ma trận cụ thể để tạo ra âm thanhnổi được khả năng trải rộng và vị trí M nghĩa là mic Mid (giữa) và S nghĩa là mic Side (bên)

3.1.95

Mã hóa phi nội [video] (non-intra coding [video])

Mã hóa của một khối hoặc hình ảnh sử dụng thông tin của cả hai trong đó khối và hình ảnh xảy ra vàonhững thời điểm khác nhau

3.1.96

Thành phần âm câm [âm thanh] (Non-tonal component [audio])

Một bộ phận của tiếng ồn giống như tín hiệu âm thanh

3.1.97

Lấy mẫu Nyquist (Nyquist sampling)

Lấy mẫu bằng hoặc cao hơn gấp đôi so với băng thông tối đa của một tín hiệu

3.1.98

Gói tiêu đề [ hệ thống] (pack [system])

Trang 18

Một gói bao gồm một tiêu đề gói theo sau là một hoặc nhiều gói tin Nó là một lớp trong hệ thống cúpháp mã hóa được mô tả trong phần 1 của tiêu chuẩn ISO/IEC 11172-1.

3.1.99

Dữ liệu gói [hệ thống] (packet data [system])

Các Byte liên tiếp của dữ liệu từ một dòng bít cơ sở là một gói dữ liệu

3.1.100

Mào đầu gói dữ liệu [hệ thống] (packet header [system])

Cấu trúc dữ liệu sử dụng để truyền đạt thông tin về dòng cơ sở dữ liệu truyền tải trong gói dữ liệu

3.1.101

Gói [hệ thống] (packet [system])

Một gói bao gồm một tiêu đề theo sau bởi một số byte tiếp theo từ dòng dữ liệu cơ sở Nó là một lớptrong cú pháp mã hóa hệ thống được mô tả trong tiêu chuẩn ISO/IEC 11172-1

3.1.102

Phương pháp đệm (Padding [audio])

Một phương pháp để điều chỉnh độ dài trung bình của một khung âm thanh trong một khoảng thời giantương ứng lấy mẫu PCM, bằng cách thêm một khe vào khung âm thanh

3.1.103

Hình tham chiếu ảnh trước [video] (past reference picture [video])

Hình ảnh đã qua là hình ảnh đã xảy ra vào một thời điểm sớm hơn so với hiện tại theo thứ tự hình ảnhhiển thị

3.1.104

Tỉ lệ pixel [video] (pel aspect ratio [video])

Tỉ lệ chiều cao của điểm ảnh pixel trên màn hình với tỉ lệ chiều rộng quy định của nó

3.1.105

Pixel

Một mẫu 8 bít của độ chói hoặc dữ liệu màu

3.1.106

Chu kỳ ảnh [video] (picture period [video])

Nghịch đảo của thông số tốc độ hình ảnh

3.1.107

Tốc độ ảnh [video] (picture rate [video])

Tốc độ của ảnh quy được quy định mà tại đó ảnh được xuất ra từ quá trình giải mã

3.1.108

Hình ảnh [video] (picture [video])

Trang 19

Dữ liệu ảnh nguồn, đã mã hóa hoặc ảnh tái tạo lại Hình ảnh nguồn, hay ảnh tái tạo lại bao gồm ba matrận hình chữ nhật trình diễn bằng 8 bít tương ứng với độ chói và 2 tín hiệu màu Lớp hình ảnh là mộttrong những lớp có cú pháp mã hóa được định nghĩa trong tiêu chuẩn ISO/IEC 11172-2

3.1.109

Băng lọc nhiều pha [âm thanh] (Polyphase filterbank [audio])

Một tập hợp các bộ lọc băng thông bằng các pha cụ thể tương quan với nhau, cho phép thực hiện môtcách hiệu quả trong thực hiện băng lọc

3.1.110

Tiên đoán [video] (prediction [video])

Việc sử dụng các yếu tố tiên đoán để cung cấp một ước tính của pixel hoặc phần tử dữ liệu đang đượcgiải mã

3.1.111

Hình ảnh mã hóa tiên đoán; ảnh P (prediction-coded picture; P-picture)

Một hình ảnh được mã hóa sử dụng tiên đoán chuyển động để bù cho hình ảnh trước đó

3.1.112

Lỗi tiên đoán [hình ] (prediction error [video])

Sự khách nhau giữa giá trị thực của giá trị điểm ảnh pixel hoặc thành phần dữ liệu và tiên đoán của nó

3.1.113

Dự đoán [hình ] (predictor [video])

Một sự kết hợp tuyến tính của các pixel giải mã trước đây hoặc các yếu tố dữ liệu

3.1.114

Mốc thời gian trình diễn; PTS [hệ thống] (presentation time-stamp; PTS [system])

Một trường mà có thể xuất hiện trong mào đầu gói tin cho biết thời gian mà một đơn vị trình diễn đượctrình diễn trong bộ giải mã đích của hệ thống

3.1.115

Đơn vị trình diễn [hệ thống] (presentation unit [system])

Một đơn vị truy cập giải mã tín hiệu âm thanh hoặc hình ảnh

3.1.116

Mô hình tâm thính học [âm thanh] (Psychoacoustic model [audio])

Một mô hình toán học tương ứng với mặt nạ thính giác của con người

3.1.117

Ma trận lượng tử hóa [video] (quantization matrix [video])

Một tập hợp gồm sáu tư giá trị 8 bít được sử dụng bởi bộ giải lượng tử

3.1.118

Hệ số DCT lượng tử [video] (quantized DCT coefficients [video])

Trang 20

Hệ số DCT trước giải lượng tử Một mã có chiều dài biến thiên được trình diễn bởi hệ số DCT là mộtphần của nén dòng bít video.

3.1.119

Hệ số tỷ lệ lượng tử [video] (quantizer scale factor [video])

Một dữ liệu cơ sở trình diễn trong dòng bít và sử dụng bởi quá trình giải mã hệ số lượng tử

3.1.120

Truy cập ngẫu nhiên (random access)

Quá trình bắt đầu đọc và giải mã dòng bít tại một điểm tùy ý

3.1.121

Ảnh mẫu [video] (reference picture [video])

Ảnh mẫu là những ảnh gần nhau nhất với ảnh I hoặc ảnh P cho ảnh hiện tại để hiển thị

3.1.122

Bộ đệm sắp xếp lại [video] (reoder buffer [video])

Một bộ đệm trong các bộ giải mã hệ thống mong muốn cho việc lưu trữ của một tái tạo ảnh I hoặc xâydựng ảnh P

3.1.123

Quá trình tái lượng tử hoá [âm thanh] (Requantization [audio])

Quá trình giải mã các mẫu băng con để mã hoá phục hồi lại giá trị lượng tử ban đầu

3.1.124

Bảo lưu (reserved)

Thuật ngữ “bảo lưu” được sử dụng trong các điều khoản quy định dòng mã hóa chỉ ra giá trị có thểđược sử dụng trong tương lai cho các phần mở rộng được xác định theo tiêu chuẩn ISO

3.1.125

Tua lại [video] (reverse play [video])

Quá trình dòng hình ảnh hiển thị chiều ngược lại thứ tự hiển thị ảnh

3.1.126

Băng điều chỉnh hệ hố [âm thanh] (Scalefactor band [audio])

Một tập hợp các đường tần số trong lớp III có cùng tỷ lệ bằng một hệ số tỷ lệ

3.1.127

Chỉ số hệ số tỷ lệ [âm thanh] (scalefactor index [audio])

Một mã số cho hệ số tỷ lệ

3.1.128

Hệ số tỷ lệ [âm thanh] (Scalefactor [audio])

Hệ số mà một tập hợp các giá trị có cùng tỷ lệ trước khi lượng tử

Trang 21

3.1.129

Tiêu đề trình tự [hình ảnh ] (sequence header [video])

Một khối dữ liệu trong dòng bít được mã hóa bao gồm trình diễn mã hóa của một số một dữ liệu cơ sở.Đây là một trong các lớp của một cú pháp mã hóa được xác định trong tiêu chuẩn ISO/IEC 11172-2

3.1.130

Thông tin phụ (Side information)

Thông tin cần thiết trong dòng bít cho việc kiểm soát các bộ giải mã

3.1.131

Khối macro nhảy cách [video] (skipped macroblock [video])

Một khối macro mà không có dữ liệu lưu trữ

3.1.132

Lát cắt ảnh [video] (slice [video])

Một loạt các khối macro Đây là một trong các lớp của cú pháp mã hóa được xác định trong phần 2 củatiêu chuẩn ISO/IEC 11172-2

3.1.133

Khe [âm thanh] (slot [audio])

Một khe là một phần không thể thiếu trong dòng bít Trong lớp I một khe bằng bốn byte, trong lớp II và III

là một byte

3.1.134

Dòng nguồn (source stream)

Một dòng không ghép kênh đơn các mẫu trước khi mã hóa nén

3.1.135

Hàm phân bố [âm thanh] (spreading function [audio])

Một hàm mô tả tần số lan truyền của mặt nạ

3.1.136

Các mã khởi đầu [hệ thống và video] (start codes [system anh video])

32 bít mã nhúng trong đó dòng bít mã hóa là duy nhất Chúng được sử dụng cho nhiều mục đích baogồm xác định một số lớp trong cú pháp mã hóa

3.1.137

Bộ đệm đầu vào STD [hệ thống] (STD input buffer [system])

Một bộ đệm vào trước ra trước của đầu vào bộ giải mã hệ thống mong muốn cho lưu trữ dữ liệu nén cơ

sở trước khi giải mã

3.1.138

Chế độ âm thanh nổi [âm thanh] (Stereo mode [audio])

Chế độ mà hai kênh âm thanh tạo thành một kênh âm thanh nổi (trái và phải) là mã hoá của một dòngbít Quá trình mã hoá giống như là ở chế độ song kênh

Trang 22

3.1.139

Nhồi (bit); nhồi (byte) (Stuffing (bits); stuffing (bytes))

Từ mã hóa có thể được chèn vào dòng bít mã hóa nén sẽ bị loại bỏ trong quá trình giải mã Mục đíchlàm tăng tốc độ bít của dòng

3.1.140

Băng con [âm thanh] (subband [audio])

Phần nhánh của băng tần số âm thanh

3.1.141

Băng lọc băng tần con [âm thanh] (subband filterbank [audio])

Một tập hợp các bộ lọc băng tần bao gồm toàn bộ giải tần âm thanh Trong phần 3 của tiêu chuẩn này

bộ lọc băng con là một bộ lọc của nhiều pha

3.1.142

Mẫu băng con [âm thanh] (subband samples [audio])

Bộ lọc băng con trong bộ mã hóa âm thanh tạo ra một trình diễn được lọc và được lấy mẫu của dòng

âm thanh Các mẫu được lọc được gọi là các mẫu băng con Từ 384 mẫu thời gian liên tiếp đầu vào, 12mẫu thời gian liên tiếp được tạo ra trong phạm vi 32 của băng con

3.1.143

Từ đồng bộ [audio]

Một mã 12 bít nhúng trong dòng bít âm thanh xác định khung đầu tiên

3.1.144

Băng lọc tổng hợp [âm thanh] (Synthesis filterbank [audio])

Băng lọc trong quá trình giải mã là xây dựng lại một tín hiệu âm thanh PCM từ mẫu băng con

3.1.145

Tiêu đề hệ thống [hệ thống] (system header [system])

Tiêu đề hệ thống là một cấu trúc dữ liệu theo quy định tại ISO/IEC 11172-1 mang thông tin tổng hợp cácđặc tính hệ thống của dòng đã ghép kênh ISO/IEC 11172

3.1.146

Bộ giải mã hệ thống đích; STD [hệ thống] (system target decoder;STD [system])

Một mô hình tham chiếu của một quá trình giải mã dùng để mô tả ý nghĩa của dòng ghép kênh ISO/IEC11172

3.1.147

Mốc thời gian [hệ thống] (time-stamp [system])

Một thuật ngữ cho biết thời gian của sự kiện

3.1.148

Bộ ba [âm thanh] (Triplet [audio])

Trang 23

Một thiết lập của 3 mẫu băng con liên tiếp tạo thành một băng con Một bộ ba hình thành từ một trong

32 băng con từ một hạt

3.1.149

Thành phần âm [âm thanh] (tonal component [audio])

Một thành phần hình sin giống như của tín hiệu âm thanh

3.1.150

Tốc độ bít thay đổi (variable bitrate)

Tác dụng của biến tốc độ bít trong suốt quá trình giải mã của dòng bít thành phần

3.1.151

Mã độ dài thay đổi; VLC (variable length coding; VLC)

Một thủ tục thuận nghịch cho mã hóa phân định từ mã hóa ngắn thường xuyên có thể xảy ra và từ mãhóa dài ít có khả năng xảy ra hơn

3.1.152

Bộ kiểm định bộ đệm video ; VBV [video] (video buffering verifier; VBV [video])

Một bộ giải mã giả thuyết là khái niệm kết nối với đầu ra của mã hóa kết thúc Mục đích của nó là đểcung cấp một hạn chế về sự thay đổi của tốc độ dữ liệu mà bộ mã hóa hoặc quá trình chỉnh sửa có thểđưa ra kết quả

3.1.153

Tuần tự video [video] (video sequence [video])

Một loạt hoặc nhiều nhóm ảnh

3.1.154

Quét zig-zag [video] (zig-zag scanning order [video])

Một tuần tự cụ thể của các hệ số DCT từ (ước lượng) không gian tần số thấp đến cao

4 Ký hiệu và thuật ngữ viết tắt

Các toán tử số học được sử dụng để mô tả tiêu chuẩn này tương tự như các toán tử được sử dụngtrong ngôn ngữ lập trình C.Tuy nhiên, phân số nguyên được làm tròn tới một giá trị cụ thể Các toán tửphân theo bít được định nghĩa giả định của hai phần bù nhau là đặc trưng của số nguyên Số và vòngđếm thường bắt đầu từ số không

% Toán tử giá trị tuyệt đối Chỉ xác định cho số dương

Sign() Sign(x) = 1 x>0

Trang 24

-1 x<0NINT( ) Toán tử số nguyên gần nhất Trả lại giá trị số nguyên gần nhất cho đối số của giátrị thực Một nửa giá trị của số nguyên được làm tròn tới không.

Căn bậc hai

Max [….] Giá trị lớn nhất trong danh sách đối số

Min [….] Giá trị nhỏ nhất trong danh sách đối số

ch Kênh Nếu ch có giá trị 0, kênh bên trái cho biết là một tín hiệu stereo hoặc tín hiệu đầu

tiên của hai tín hiệu độc lập.(âm thanh)nch Số lượng kênh; kết quả là 1 cho chế độ đơn kênh; 2 cho chế độ còn lại (âm thanh)

gr Hạt của 3*32 mẫu băng tần con trong lớp âm thanh II, 18*32 mẫu băng tần con trong lớp

âm thanh III (âm thanh)main_data Phần dữ liệu chính của dòng bít chứa hệ số tỷ lệ, mã hoá dữ liệu Huffman, và thông tin

phụ thuộc (âm thanh)main_data_beg Vị trí trong dòng bít của dữ liệu chính khởi đầu của một khung Vị trí là kết quả

của vị trí kết thúc trước khi thêm dữ liệu chính của khung trong một bit Nó là quá trìnhtính từ giá trị dữ liệu kết thúc của khung trước (âm thanh)

part2_legnth Số lượng của bít dữ liệu chính sử dụng cho hệ số tỷ lệ (âm thanh)

rpchof Hệ số đa thức còn lại, bậc cao nhất trước tiên (âm thanh)

sb Băng tần con (âm thanh)

sblimit Số lượng của băng tần con ít nhất mà không có bít nào được phân bổ (âm thanh)scfsi Hệ số tỷ lệ chọn lọc thông tin (âm thanh)

switch_point_I Số dải tần ( khối dải tần dài) từ một điểm trên cửa sổ nguồn được sử dụng (âm

thanh)

Trang 25

switch_point_s Số dải tần ( khối dải tần ngắn) từ một điểm trên cửa sổ nguồn được sử dụng (âm

thanh)uimsbf kiểu unsigned int, bít đầu là quan trọng nhất

vlclbf Mã chiều dài biến, bít đầu tiên bên trái, trong đó “bên trái” dùng để chỉ thứ tự mà mã

VLC được viết trong phụ lục B

window Số khe thời gian hiện tại của block_type==2,0 ≤ window ≤ 2 (âm thanh)

Thứ tự byte của các lệnh multi-byte là byte đầu tiên quan trọng nhất

4.7 Hằng số

pi 3.14159265359

e 2.71828182846

5 Phương pháp mô tả cú pháp dòng bít

Dòng bít thu được từ bộ giải mã được mô tả trong mục 7 Mỗi mục dữ liệu trong dòng bít được in đậm

Nó được mô tả bằng tên, chiều dài của nó bằng các bít, và được lưu lại về loại, thứ tự truyền của nó.Căn nguyên của hành động giải mã một phần dữ liệu trong một dòng bít phụ thuộc vào giá trị của phần

tử dữ liệu đó và các yếu tố dữ liệu được giải mã trước đây Việc giải mã các phần tử dữ liệu và xác địnhcác biến trạng thái được sử dụng trong bộ giải mã được mô tả trong mục 8 Các cấu trúc sau đây được

sử dụng để diễn tả các điều kiện khi phần tử dữ liệu có mặt và là kiểu bình thường

While (condition) {Nếu điều kiện đúng, thì nhóm phần tử dữ liệu sẽ xuất hiện trong chuỗi dữ liệu

data_element tiếp theo Quá trình này lặp lại cho đến khi điều kiện sai

…

}

Do {

data_element Phần tử dữ liệu luôn luôn xảy ra ít nhất một lần…}

while (condition) {Phần tử dữ liệu được lặp lại cho đến khi điều kiện sai.}

If (condition) {Nếu điều kiện đúng, thì nhóm dữ liệu đầu tiên sẽ xuất hiện tiếp theo trong

data_element dòng dữ liệu}

else {

data_element Nếu điều kiện sai, thì nhóm dữ liệu thứ hai của các phần tử dữ liệu sẽ xuất hiệntrong dòng dữ liệu tiếp theo}

for ( i=0 ; i < n ; i++) {Nhóm các phần tử dữ liệu xuất hiện n lần Cấu trúc có điều kiện trong nhóm

data_element các phần tử dữ liệu có thể phụ thuộc vào giá trị của vòng điều khiển biến i,được đặt bằng 0 cho lần xuất hiện đầu tiên, tăng lên 1 cho lần xuất hiện thứ hai, và vân vân }

Như đã lưu ý, nhóm các phần tử dữ liệu có thể chứa các cấu trúc có điều kiện lồng nhau Chính xác, {}được bỏ qua khi chỉ có một phần tử dữ liệu

data_element [ ] data_element [ ] là một mảng của dữ liệu Số dữ liệu cơ bản chỉ ra trong từngngữ cảnh

data_element [n] là phần tử thứ n + 1 của mảng dữ liệu.data_element [m] [n] data_element

[m][n] thứ m+1, n+1 cơ bản của hai mảng thứ nguyên của dữ liệudata_element [l] [m] [n] data_element

[l][m][n] là thứ l+1,m+1,n+1 cơ bản của ba thứ nguyên của dữ liệu

data_element [m n] là phạm vi bao gồm các bít giữa bít m và bít n trong data_element

Trong khi cú pháp được trình diễn bằng các điều kiện, không nên thừa nhận mục 8.4.3 thực hiện thỏađáng thủ tục giải mã Cụ thể, nó xác định dòng bít đầu vào đúng và không có lỗi Bộ giải mã thực tế phảibao gồm một cách thức để tìm mã bắt đầu để bắt đầu giải mã một cách chính xác, và để xác định cáclỗi, hành động xóa bỏ hay thêm vào trong khi giải mã Các phương pháp để xác định trong trường hợpnày, và các hành động tiếp nhận không được chuẩn hóa

Trang 26

Định nghĩa chức năng của bytealigned

Chức năng bytealigned () trả về 1 nếu vị trí hiện tại là một ranh giới byte, đó là các bít tiếp theo trongdòng bít là bít đầu tiên của một byte

Định nghĩa chức năng của nextbits

Chức năng nextbits () cho phép so sánh một dòng bít với bít tiếp theo để được giải mã trong dòng bít

Định nghĩa chức năng của next_start_code

Chức năng next_start_code () loại bỏ bất kỳ bít 0 và nhồi thêm byte và xác định đúng vị trí của mã bắtđầu tiếp theo

6 Các yêu cầu của cấu trúc mã hóa và tham số

6.1 Hàm chuỗi âm thanh

BslbfBslbfBslbfBslbfBslbfBslbfBslbfBslbfBslbf

Trang 27

6.4 Hàm kiểm tra lỗi

2

uimsbfuimsbf

bslbf

Trang 28

uimsbfuimsbf

1129841

uimsbfbslsfbslbf

bslbfuimsbfuimsbfuimsbfbslbfbslbf

Trang 29

bslbfuimsbfbslbfuimsbf

bslbfbslbfbslbfbslbfbslbfbslbf

Dữ liệu dòng bít chính được được xác định dưới đây Trường main_data trong cú pháp hàm

audio_data() chứa byte từ dòng bít dữ liệu chính Tuy nhiên, do tính chất biến đổi của mã hóa Huffman

được sử dụng trong lớp III, dữ liệu chính cho một khung thường không theo thông tin tiêu đề và thông

tin phụ cho khung đó Main_data cho một khung bắt đầu tại một vị trí trong dòng bít đang xử lý tiêu đề của khung tại một bù giá trị âm được cho bởi giá trị main_data_begin (Xem định nghĩa

Trang 30

Cú pháp Số bit Nhận dạng

scalefac_1[gr][ch][sfb]

if((scfsi[ch][1]==0 || (gr==0))for (sfb=6 ;sfb<11 ;sfb++)scalefac_1[gr][ch][sfb]

signyis[l] = x

signwif(x!=0)

signxif(y!=0)

signyis[l] = v

1 61111

bslbfuimsbfbslbfuimsbfbslbf

bslbfbslbfbslbfbslbfbslbf

Trang 31

2 Ngữ nghĩa cho cú pháp dòng bít âm thanh

2.1 Chuỗi âm thanh chung

Frame – Lớp I và lớp II: Một phần của dòng bít có thể tự giải mã được Trong lớp I nó chứa thông

tin cho 384 mẫu và trong lớp II là 1152 mẫu Nó bắt đầu với một từ đồng

bộ hóa và kết thúc bằng từ mã đồng bộ hóa tiếp theo Nó bao gồm một sốnguyên các khe (bốn byte trong lớp I, một byte trong lớp II)

- Lớp III: Một phần của chuỗi bít có khả năng giải mã với việc sử dụng các thông

tin chính đã dùng trước đây Trong lớp III nó chứa thông tin của 1152mẫu Mặc dù khoảng cách giữa hai từ mã đồng bộ hóa liên tiếp là một sốnguyên các khe (một byte trong lớp III), các thông tin âm thanh thuộc mộtkhung thường không được chứa giữa hai từ mã đồng bộ liên tiếp

2.2 Khung âm thanh

Header - một phần của dòng bít chứa thông tin đồng bộ hóa và trạng thái thông tin.

Error_check - một phần của dòng bít chứa thông tin để phát hiện lỗi.

Audio_data - một phần của dòng bít chứa thông tin trong các mẫu âm thanh.

Ancillary_data – một phần của dòng bít có thể được sử dụng cho dữ liệu phụ trợ.

Khi lớp thay đổi, khôi phục lại bộ giải mã âm thanh được yêu cầu

Bit_bảo vệ (protection_bit) - một bít được thêm vào dòng bít âm thanh để tạo điều kiện phát hiện

lỗi và giấu lỗi Bằng ‘1’ nếu không có sự dư thừa thêm vào, bằng ‘0’ nếu có sự dư thừa thêm vào

bit_rate_index: cho biết tốc độ bít Tất cả các giá trị zero cho biết vị trí “định dạng tự do”, trong đó

có một tốc độ bít cố định không nhất thiết phải nằm trong danh sách sử dụng Cố định có nghĩa làmột khung có chứa khe N hoặc N+1, tùy thuộc vào giá trị của bít đệm Các bit_rate_index là mộtchỉ số trong một bảng, giá trị khác nhau cho các lớp khác nhau Bit_rate_index chỉ ra tổng tốc độbít không kể các chế độ (stereo, joint_stereo, dual_channel, single_channel)

Trang 32

Đối với lớp II, không phải tất cả các kết hợp của tổng tốc độ bít và các chế độ đều cho phép Xem

ở mục 3 phụ lục B, bảng 3-B.2 “ Bảng các bít được sử dụng trong lớp II”

tùy chọn 324856648096112128160192224256320384Cấm

tùy chọn 32404856648096112128160192224256320Cấm

Để đáp ứng độ trễ và phức tạp nhất có thể, bộ giải mã không bắt buộc phải hỗ trợ tốc độ bít biếnđổi liên tục khi ở lớp I hoặc II Lớp III hỗ trợ tốc độ biến đổi bít bằng cách chuyển bit_rate_index.Tuy nhiên, trong định dạng tự do, tốc độ bít cố định là bắt buộc Quá trình giải mã không yêu cầutốc độ bít cao hơn 448 kbits/s, 384 kbits/s, 320 kbit/s trong quan hệ giữa các lớp I, II và III khi ởchế độ định dạng tự do

Đối với lớp II, không phải tất cả sự phối hợp của tổng tốc độ bít và chế độ là được chấp thuận.Xem bảng dưới đây

free format324856648096112128160192224256320384

all modessingle_chanelsingle_chanelsingle_chanelall modessingle_chanelall modesall modesall modesall modesall modesstereo, intensity stereo, dual chanelstereo, intensity stereo, dual chanelstereo, intensity stereo, dual chanelstereo, intensity stereo, dual chanel

Tần số lấy mẫu (sampling_frequency) - cho biết tần số lấy mẫu, theo bảng dưới đây.

Dự phòng

Trang 33

Một thiết lập lại bộ giải mã để thay đổi tốc độ lấy mẫu

Bit đệm (padding_bit) – nếu bít này bằng ‘1’ thì khung sẽ thêm một khe cắm để điều chỉnh tốc độ

trung bình với tần số lấy mẫu, nếu không bít này sẽ nhận giá trị ‘0’ Padding là chỉ sự cần thiết vớitần số lấy mẫu của 44,1 kHz Padding cho phép yêu cầu trong định dạng tự do

Padding yêu cầu áp dụng cho dòng bít như tích chiều dài của khung mã hoá, sau một số nào đócua khung tín hiệu không đi sai đường thêm nữa (khe +0,-1) từ giá trị được tính như sau:

accumulated frame length =

mỗi khung âm thanh sau:

if(Layer==1) dif = (12*tốc độ bít)%sampling_frequency;

else dif =(144*tốc độ bít)%sampling_frequency;

private_bit - là bít được sử dụng cho cá nhân Bít này sẽ không được ISO sử dụng về sau.

mode – chỉ ra các chế độ theo bảng sau Trong lớp I và II, chế độ joint_stereo là intensity_stereo,

trong lớp III là intensity_stereo và ms_stereo

Trong lớp I, tất cả các chế độ trừ chế độ stereo, cho giá trị giới hạn bằng 32 Trong lớp II, tất cảcác chế độ trừ chế độ joint_stereo, cho giá trị giới hạn là sblimit Giới hạn trong chế độ joint_stereo

là xác định bởi chế độ mở rộng

Chế độ mở rộng (mode_extension) – các bít này được sử dụng trong chế độ joint_stereo Lớp I

và II chỉ ra các dải băng tần con nằm trong intensity_stereo Các giải băng tần con khác được mãhóa trong âm thanh nổi

Trang 34

Trong lớp III, chúng cho biết loại phương pháp mã hóa âm thanh chung được áp dụng Các dải tần

mà các chế độ intensity_stereo và ms_stereo được áp dụng là ẩn trong thuật toán Tham khảothêm thông tin tại 8.4

offoffonon

Trường copyright – nếu bít này bằng ‘0’ thì không có bản quyền trên chuỗi mã hóa bit, ‘1’ nghĩa là

bít ký tự chẵn lẻ được sử dụng trong tùy chọn phát hiện lỗi trong dòng bít được mã hóa

2.5 Dữ liệu âm thanh, lớp I

allocation[ch] [sb] – chỉ thị số lượng các bít được sử dụng để mã hóa mẫu trong băng tần con sb

của kênh ch Để được băng tần con trong chế độ intensity thì dòng bít phải có một phân bổ dữ liệu

cơ sở cho mỗi băng tần con

allocation [ch][sb] Số bít cho mỗi mẫu

0123456789101112131415

023456789101112131415Cấm

Chú ý: Đối với mã ‘0000’ là không mẫu nào được chuyển giao.

scalefactor[ch] [sb]: chỉ ra các yếu tố của băng tần con sb của kênh ch bằng cách lấy các mẫu đã

được yêu cầu của băng tần con Sáu bít tạo thành một số nguyên unsigned, chỉ số được ghi trongmục 3 phụ lục B, bảng 3 – B.1 “Hệ số tỷ lệ Lớp I, II” Có giá trị cho chế độ đơn kênh

Trang 35

sample[ch] [sb] [s]: trình diễn mã của mẫu thứ s trong băng tần con sb của kênh ch Phù hợp với

các băng tần con đơn kênh và cho các băng tần con ở chế độ intensity_stereo Trường hợp còn lại

có giá trị cho cả hai kênh

2.6 Dữ liệu âm thanh lớp II

allocation[ch] [sb]: chứa thông tin liên quan đến bộ lượng tử hóa sử dụng cho các mẫu trong băng

tần con sb của kênh ch, mặc dù thông tin của ba mẫu liên tiếp được nhóm lại thành một mã số, và

số lượng bít được sử dụng để mã hóa mẫu Ý nghĩa và chiều dài của trường này phụ thuộc vào sốlượng băng tần con, tốc độ bít, và tần số lấy mẫu Các bít trong trường này tạo thành một sốnguyên unsigned được sử dụng như là một chỉ mục cho bảng có liên quan trong mục 3 phụ lục B,bảng 3-B.2 “BẢNG PHÂN BỔ bít LỚP II”, cho biết số lượng mức độ được sử dụng để định lượng 3– phụ lục B, bảng 3-B.4 “ CÁC LỚP CỦA QUÁ TRÌNH LƯỢNG TỬ HÓA TRONG LỚP II” cung cấpthông tin bổ sung liên quan đến từng lượng tử có thể: hệ số thu hồi, cho dù nhóm đã được sử dụng,

số lượng mẫu trên mỗi mã, và số bít trên mỗi mã Một số bảng khác cho các kết hợp giữa tốc độ bít

và tần số lấy mẫu khác nhau, xem 3 – phụ lục B, Bảng 3-B.2 “BẢNG PHÂN BỔ BÍT LỚP II” Điềunày có giá trị cho các băng tần con đơn kênh hoặc các băng tần con ở chế độ hiệu ứng _stereo.Trong trường hợp sau, phân bổ có giá trị cho cả hai kênh

scfsi[ch] [sb] – thông tin lựa chọn hệ số tỷ lệ Điều này cho biết thông tin về số lượng các hệ số tỷ

lệ được chuyển cho băng tần con sb và các phần của tín hiệu trong khung này là hợp lệ Khungđược chia thành ba phần bằng nhau của 12 mẫu băng tần con cho mỗi băng tần con

ba yếu tố tỷ lệ truyền, đối với các phần 0,1,2 tương ứng

hai biến tỷ lệ truyền, đầu tiên có giá trị cho các bộ phận 0 và 1, thứ hai cho phần 2.một thang đo tỷ lệ truyền, có giá trị cho cả ba phần

hai biến tỷ lệ truyền, biến 1 cho phần 0, biến thứ hai cho phần 1 và 2

scalefactor[ch] [sb] [p]: chỉ ra ba yếu tố mà các mẫu lượng tử hóa của băng tần con sb của kênh

ch và một phần p của khung được nhân lên sáu bít tạo thành số nguyên không dấu, chỉ dẫn trong3-phụ lục B, bảng 3-B.1 “ HỆ SỐ TỶ LỆ LỚP I, II” Phù hợp ở chế độ đơn kênh

: là hàm chủ định, việc nhóm có ảnh hưởng cho việc mã hóa các mẫu trong băng con sb của kênh

ch Việc nhóm có nghĩa rằng ba mẫu liên tục của băng con sb hiện tại trong kênh ch trong hạt(granule) gr được mã hóa và được truyền sử dụng một từ mã chung và không sử dụng ba từ mãriêng biệt grouping[ch] [sb] là true nếu trong bảng bít Allocation hiện tại được sử dụng (xem Phụlục B.2) giá trị tìm thấy dưới hàng kênh con sb (row) và hàm allocation[sb] (column) là 3, 5 hay 9.Ngược lại có giá trị là false Với các băng con trong chế độ intensity_stereo việc nhóm là phù hợpcho cả các kênh

samplecode[ch] [sb] [gr]: mã hóa trình diễn của ba mẫu liên tiếp trong hạt gr của băng tần con sb

của kênh ch Là phù hợp với các băng tần con đơn kênh và cho các băng tần con ở chế độintensity_stereo Trong trường hợp sau, mã hóa có giá trị cho cả hai kênh

Sample[ch] [sb] [s]: trình diễn mã hóa của mẫu thứ s trong băng tần con sb của kênh ch Phù hợp

với các băng tần con đơn kênh và cho băng tần con ở chế độ intensity_stereo Trong trường hợpsau, mã hóa có giá trị cho cả hai kênh

2.7 Dữ liệu âm thanh, lớp III

main_data_begin – Giá trị của main_data_begin được sử dụng để xác định vị trí của bít đầu tiên

cho dữ liệu chính của khung

main_data_end – giá trị main_data_end được sử dụng để xác định vị trí trong dòng bít của các bít

cuối cùng cho dữ liệu chính của khung

private_bits – bít sử dụng cho cá nhân Các bít này sẽ không sử dụng cho tương lai bởi ISO.

Trang 36

main_data _beg – Điều này cho phép các vị trí trong dòng bít khởi đầu của khung main_data Vị

trí là kết quả từ vị trí kết thúc của khung main_data trước cộng với một bit Nó được tính từ giá trịmain_data_end của khung trước đó

main_data – Phần main_data của dòng bít chứa hệ số tỷ lệ, Huffman mã hoá dữ liệu và thông tin

phụ trợ

scfsi[ch] [scfsi_band] – Trong lớp III, thông tin lựa chọn của thang đo hoạt động tương tự như

các lớp I và II Sự khác biệt chính là việc sử dụng các biến scfsi_band để áp dụng scfsi cho cácnhóm hệ số tỷ lệ thay vì hệ số tỷ lệ đơn lẻ Scifsi kiểm soát tỷ lệ phạm vi sử dụng trong các hạt

Scfsi [scfsi_band]

‘0’

‘1’

hệ số tỷ lệ được truyền cho mỗi hạt

hệ số tỷ lệ lớn truyền cho hạt 0 cũng phù hợp cho hạt 1

Nếu cửa sổ ngắn được bật, tức là block_type==2 cho một trong các hạt, thì scfsi luôn luôn là 0 chokhung này

scfsi [scfsi_band] [ch] – giống như scfsi [scfsi_band] nhưng để sử dụng trong chế độ âm thanh

lập thể, joint_stereo hoặc dual_channel

scfsi_band – scfsi_band kiểm soát việc sử dụng các thông tin lựa chọn hệ số tỷ lệ cho các nhóm

(scfsi_bands)

Scfsi_band Các băng hệ số tỷ lệ (xem Bảng B.8)

0123

0,1,2,3,4,5,6,7,8,9,1011….1516….20

part2_3_length [gr] [ch] – giá trị này chứa số bít main_data sử dụng cho hệ số tỷ lệ và dữ liệu mã

Huffman Bởi vì độ dài của thông tin phụ luôn như nhau, giá trị này có thể được sử dụng để tínhtoán vị trí của thông tin chính khởi đầu cho từng hạt và vị trí của thông tin bổ sung (nếu sử dụng)

big_values [gr] [ch] – các giá trị phổ của mỗi hạt được mã hoá với bảng mã Huffman khác Dải tần

số đầy đủ khác nhau từ số không đến tần số Nyquist được chia thành nhiều khu vực, mà sau đóđược mã hoá sử dụng các bảng khác nhau Phân vùng được thực hiện theo các giá trị lượng tửhoá tối đa Điều này được thực hiện với giả thiết rằng các giá trị ở các tần số cao hơn sẽ có biên độthấp hơn hoặc không cần mã hoá tất cả Bắt đầu ở tần số cao, các cặp giá trị số lượng bằng đượctính 0 Số này được đặt tên là “rzero” Sau đó, đếm được bốn lần các giá trị lượng tử với giá trị tuyệtđối không vượt quá 1 (tức là chỉ có 3 mức lượng tử hoá có thể) Số này được đặt tên là “count 1”.Một lần nữa lại có một số giá trị Cuối cùng, số cặp giá trị trong vùng phổ mở rộng xuống còn 0được đặt tên là “big_value” Giá trị tuyệt đối tối đa trong phạm vi này bị hạn chế 8191

Hình vẽ cho thấy phân vùng:

xxxxxxxxxxxxxx -00000000000000000000000000000000000000000000

1 bigvalues*2 bigvalues*2*count1*4 iblen

Các giá trị 000 là zero tất Họ số là một bội số của 2

Các giá trị - là -1,0 hoặc +1 Họ số là một bội số của 4

Các giá trị xxx không bị ràng buộc Họ số là một bội số của 2

iblen là 576

global_gain [gr] [ch] – thông tin kích thước lượng tử được truyền đi trong các biến thông tin

global_gain Nó được định lượng logarit Đối với việc áp dụng global_gain, tham khảo công thức8.4, “Công thức cho lượng tử hoá và tất cả các tỷ lệ”

scalefac_compress [gr] [ch] – chọn số bít được sử dụng cho việc truyền tải của hệ số tỷ lệ theo

bảng sau:

Nếu block_type là 0,1 hoặc 3:

Trang 37

Slen1: chiều dài của các thang đo tỷ lệ cho các băng tần tỷ lệ 0 đến 10

Nếu block_type là 2 và switch_point là 0:

Nếu block_type là 2 và switch_point là 1:

Slen1: chiều dài của các thang đo tỷ lệ cho các dải tần số của thang đo từ 0 đến 7 (dải thời

gian dài của bộ khuếch đại) và 4 đến 5 ( dải tần số ngắn của cửa sổ) Lưu ý: Dải băng

từ 0 đến 7 có trong bảng “long window hệ số tỷ lệ band” và dải tần số -11 “shortframe bảng ngắn” Sự kết hợp các phân vùng này tiếp giáp và kéo dài toàn bộdải tần số

Slen2: chiều dài của các hệ số tỷ lệ tỷ lệ cho các dải tần số từ 6 đến 11

Scalefac_compress [gr] slen1 Slen2

0123456789101112131415

0000311122233344

0123012312312323

window_switching_flag[gr][ch] – tín hiệu của khối sử dụng một cửa sổ theo một cách khác so

với bình thường (kiểu 0)

Nếu window_switching_flag được thiết lập, một số biến khác được thiết lập mặc định:

region0_count = 7 (trong trường hợp block_type==1 hoặc block_type==3

hoặc block_type==2 và mixed_block_flag)

region0_count = 8 (trong trường hợp block_type==2 và không có mixed_block_flag)

region1_count = 36 như vậy tất cả các giá trị còn lại trong khoảng big_value là chứa trong vùng 1 scalefac_compress[gr][ch] – giống như Scalefac_compress[gr] nhưng để sử dụng trong âm

thanh lập thể, chế độ joint_stereo hoặc dual_channel.

blocksplit_flag[gr][ch] – tín hiệu cho thấy khối sử dụng khác hơn (loại 0) cửa sổ bình thường.

Nếu bocksplit_flag được thiết lập, một số biến khác được đặt mặc định:

Region_address1= 8 (trong trường hợp block_type ==1 hoặc block_type ==3)

Trang 38

Region_address1= 9 (trong trường hợp block_type ==2) Region_address1= 0 Trong trường hợp này độ dài của vùng 2 là zero.

Nếu blockplit_flag không được đặt, thì giá trị của block_type bằng không.

blocksplit_flag[gr][ch] – giống như blocksplit_flag [gr] nhưng để sử dụng trong âm thanh lập thể,

chế độ joint_stereo hoặc dual_channel

block_type[gr][ch] – chỉ ra loại cửa sổ cho các lõi thực tế (xem mô tả về bộ lọc băng, lớp III).

Block_type [gr]

0123

Dự phòngkhởi đầu khối

3 cửa sổ nhỏkết thúc khối

Block_type và mixed_block_flag cung cấp thông tin về việc lắp ráp các giá trị trong khối và về

chiều dài và số lượng các biến đổi (xem Phụ lục A, hình A.4 cho sơ đồ mạch, Phụ lục C cho một

mô tả phân tích) Trong trường hợp block_type = 2 điểm switch_point cho biết liệu một số bộ lọc

con của polyphase được mã hoá bằng cách sử dụng các phép biến đổi dài ngay cả trong trường

hợp block_type 2 Bộ lọc nhiều pha được mô tả trong mục 8.2.

Trong trường hợp khối dài (block_type không bằng 2 hoặc trong các băng tần con dưới của

block_type2), IMDCT tạo ra một đầu ra của 36 giá trị với mỗi 18 giá trị đầu vào Các đầu ra đượccửa sổ độc lập vào block_type và nửa đầu là gối lên nhau với nửa thứ hai của khối trước Véc tơkết quả là đầu vào của một phần tổng hợp của màng lọc đa phần của một dải

Trong trường hợp các khối ngắn (trong các cặp con phía trên của khối loại 2), ba biến đổi đượcthực hiện với 12 giá trị đầu ra Ba véc tơ được lập trình và chồng lên nhau Kết nối 6 số 0 trên cảhai đầu của véc tơ kết quả cho một véc tơ có độ dài 36, được xử lý như đầu ra của một biến

block_type[gr][ch] – giống như block_type[gr] nhưng để sử dụng trong âm thanh lập thể, chế độ

joint_stereo hoặc dual_channel

switch_point[gr] – báo hiệu điểm chia của biến đổi ngắn/dài Bảng dưới đây cho thấy số dải tần

số trên mã chuyển mạch cửa sổ (tức là block_type khác với 0) được sử dụng.

switch_point[gr][ch] – giống như Switch_point[gr] nhưng để sử dụng trong âm thanh lập thể, chế

độ joint_stereo hoặc dual_channel

switch_point_1 – Số băng tần hệ số tỷ lệ (băng tần tỷ lệ dài khối) từ điểm trên cửa sổ chuyển

mạch được sử dụng

switch_point_s - Số băng tần hệ số tỷ lệ (băng tần tỷ lệ khối ngắn) từ điểm trên cửa sổ chuyển

mạch được sử dụng

cb_limit – Số băng tần cho các khối dài (block_type! =2) Đây là một hằng số,21, cho lớp III ở tất

cả các chế độ và tại tất cả các tần số lấy mẫu

cb_limit_short – Số băng tần cho các khối ngắn (block_type =2) Đây là một hằng số, 12, cho lớp

III ở tất cả các chế độ và tại tất cả các tần số lấy mẫu

window - Sổ khe thời gian thực tế trong trường hợp block_type ==2, 0 = window = 2.

Trang 39

table_select [gr] [ch] [region] - (Bảng lựa chọn [vùng][gr][ch]) – giống như table_select[region][gr]

nhưng để sử dụng trong âm thanh lập thể, chế độ joint_stereo hoặc dual_channel

subblock_gain[gr][ch][window]– chỉ ra mức tăng bù (lượng tử hoá: yếu tố 4) từ mức tăng chung

cho một khối con Chỉ được sử dụng với loại khối 2 ( cửa sổ ngắn) Các giá trị của khối con phải

được chia cho 4^subblock_gain (cửa sổ) trong bộ giải mã.

region_adress1[gr] [ch] –một phần chia thêm của phổ được sử dụng để tăng cường hiệu suất

của mã hoá Huffman Đây là một phân khu của khu vực được mô tả bởi big_values Mục đích của

phân mục này là để có được lỗi tốt hơn và hiệu quả mã hoá tốt hơn Ba khu vực được sử dụng,mỗi khu vực được mã hoá bằng cách sử dụng một bảng mã Hufman khác nhau tuỳ thuộc vào giátrị lượng tử hoá tối đa và các số liệu thống kê tín hiệu nội bộ

Các giá trị region_adress [1,2] được sử dụng để chỉ tới ranh giới của các vùng Ranh giới khu vực

được sắp sếp theo phân chia của phổ thành các dải tần quan trọng

Trong trường hợp block_type ==2 (khối ngắn) các dải tần số cho các khe thời gian khác nhau được tính riêng Nếu swich_type ==0, tổng số lượng băng tần hệ số tỷ lệ cho hạt trong trường hợp này là 12*3=36 Nếu block_type ==2 và switch_point ==1, số lượng các băng tần hệ số tỷ lệ là 8+9*3 =35 Region_address 1 đếm số dải tần số cho đến cạnh trên của vùng đầu tiên.

region_address2 [gr] [ch] - region_address 2 đếm một phần của dải tần số hoặc toàn bộ trong

vùng 3 Một lần nữa nếu block_type =2 các dải tần số cho các khe thời gian khác nhau được tính

riêng

preflag [gr] [ch] – đây là một phím tắt để biết thêm khuếch đại tần số cao của các giá trị lượng tử

hoá Nêú cài đặt trước, các giá trị của một bảng sẽ được thêm vào các biến tỷ lệ (xem Phụ lục B,bảng B.6) Điều này tương đương với việc nhân các hệ số tỷ lệ đã được yêu cầu với các giá trị

bảng Preflag không bao giờ được sử dụng nếu block_type ==2 (khối ngắn).

scalefac_scale[gr][ch] – Hệ số tỷ lệ được logarith lượng tử hóa với kích thước bước 2 hoặc (√ 2)

tuỳ thuộc vào scalefac_scale bảng sau chỉ ra nhân hệ số tỷ lệ sử dụng trong cân bằng tái lượng tửhóa cho mỗi kích thước bước

Scalefac_scale [gr] Scalefac_multiplier

01

0,51

count1table_select[gr][ch] – Cờ này chọn một trong hai bảng mã Huffman có thể có cho vùng

bốn lần các giá trị lượng tử với độ lớn không vượt quá 1

Count1table_select[gr]

01

Bảng B.7-ABảng B.7-A

scalefac_l[gr][ch][sfb], scalefac_s[gr][ch][sfb][window], is_post[sfb] – các hệ số tỷ lệ được sử

dụng để tô màu cho nhiễu lượng tử Nếu nhiễu lượng tử được tô màu với đúng hình dạng, nó sẽđược ẩn hoàn toàn Không giống như lớp I và II, các quy ước tỷ lệ lớp 3 không nói gì về tối đa cục

bộ của tín hiệu lượng tử hoá Trong lớp III, các hệ số tỷ lệ được sử dụng trong bộ giải mã để cóđược các yếu tố phân chia cho các khối giá trị Trong trường hợp lớp III, các khối kéo dài qua mộtvài dải tần số Các khối này được gọi là dải tần số và được lựa chọn để gần với các băng tần quantrọng càng gần càng tốt

Trang 40

Bảng scalefac_compress cho thấy các thang tỷ lệ 0…10 có khoảng từ 0 đến 15 (chiều dài tối đa 4

bit) và các thang tỷ lệ 11…21 có khoảng từ 0 đến 7 (chiều dài tối đa 3 bit)

Nếu cường độ được kích hoạt (modebit_extension), các bậc thang của “zero_part” của kênh khác biệt (bên phải) được sử dụng làm các vị trí cường độ (xem mục 8.4 MS_stereo).

Phân chia của phổ thành các hệ số tỷ lệ băng tần được cố định cho mỗi khối chiều dài và tần sốlấy mẫu và được lưu trữ trong các bảng trong bộ giải mã và bộ giải mã (xem Bảng B.8)

Các yếu tố hệ số tỷ lệ được định lượng logarit Bước lượng tử được thiết lập với scalefac_scale.

huffman_code_bits() Dữ liệu mã hóa Huffman

Cú pháp Huffmancodebits() cho thấy các giá trị được lượng tử hóa mã hóa như thế nào Trongphân vùng big_values, các cặp giá trị được định lượng có giá trị tuyệt đối dưới 15 được mã hoátrực tiếp sử dụng mã Huffman Các mã được chọn từ bảng thông số từ 0 đến 31 trong bảng B.7.Luôn luôn có cặp giá trị (x.y) được mã hóa Nếu các giá trị đã được lượng tử hoá có độ lớn hơnhoặc bằng 15 được mã hóa, các giá trị được mã hoá bằng một trường riêng sau mã Huffman Nếumột hoặc cả hai giá trị của một cặp không phải là không, một hoặc hai dấu bít được nối vào từ mã

Các bảng Huffman cho phân vùng big_values bao gồm ba tham số:

hcod [|x|] [|y|] là mục nhập bảng mã Huffman cho giá trị x,y

hlen [|x|] [|y|] là mục nhập bảng chiều dài Huffman cho giá trị x,y

linbits là chiều dài của linbitsx hoặc linbitsy khi chúng được mã hóa

Cú pháp cho huffmancodebits chứa các trường và tham số sau:

sign v là tín hiệu của v (0 nếu dương 1 nếu âm)

sign w là tín hiệu của w (0 nếu dương 1 nếu âm)

signx là tín hiệu của vx (0 nếu dương 1 nếu âm)

signy là tín hiệu của y (0 nếu dương 1 nếu âm)

linbitsx được sử dụng để mã hóa giá trị của x nếu cường độ x lớn hơn hoặc

bằng 15 Trường này chỉ được mã hoá nếu Ixl trong heod bằng 15.Nếu linbits là zero, do đó không có bít nào được mã hoá khi lxl = 15,thì giá trị linbitsx được xác định bằng 0

linbitsy cũng giống như linbitsx nhưng đối với y

is[l] giá trị được lượng tử hóa cho dòng tần số số I

Các trường linbitsx hoặc linbitsy chỉ được sử dụng nếu giá trị lớn hơn hoặc bằng 15 cần được mãhóa Các trường này được diễn giải như là các số nguyên không dấu và thêm vào 15 để đạt đượcgiá trị mã hóa Các trường linbitsx và linbitsy không bao giờ được sử dụng nếu bảng được chọn làmột cho các khối với giá trị lượng tử tối đa ít hơn 15 Chú ý rằng giá trị 15 có thể vẫn được mã hóavới bảng huffnam cho các bít mù (linbits) bằng không Trong trường hợp này, các trường linbitsx

và linbitsy thực tế không được mã kể từ khi bít linbits bằng không

Đối với các phần count1, bộ 4 giá trị với biên độ nhỏ hơn hay bằng 1 được mã hóa Còn lại các giátrị biên độ còn lại được mã sử dụng mã Huffman từ bảng A, hay B trong Bảng B.7 Còn lại, cho mỗigiá trị khác không, một bít dấu được xuất hiện sau biểu tượng mã huffman

Các bảng Huffman cho phần count1 bao gồm các thông số sau:

hcod[|v|] [|w|][|x|] [|y|]) là mục nhập bảng mã Huffman cho giá trị v,w,x,y

hlen[|v|] [|w|][|x|] [|y|] là mục nhập bảng chiều dài Huffman cho giá trị v,w,x,y

Định dạng
Số trang	155
Dung lượng	3,73 MB