1. Trang chủ
  2. » Luận Văn - Báo Cáo

Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam

93 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 93
Dung lượng 1,55 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Khi mẫu hoá một tín hiệu tương tự, ta luôn gặp phải 2 vấn đề: thứ nhất, mỗi giá trị kế tiếp trong dạng biểu diễn dạng số là một quãng xác định nào đó của thời gian, và mỗi khối có một độ

Trang 1

trường đại học bách khoa hà nội



luận văn thạc sĩ khoa học

ngành : kỹ thuật điện tử

công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam

đỗ thị phượng uyên

Hà nội - 2008

Trang 2

trường đại học bách khoa hà nội



luận văn thạc sĩ khoa học

công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam

Trang 3

TÓM TẮT LUẬN VĂN

Luận văn "Công nghệ phát thanh số - Ứng dụng và triển khai trong

tương lai ở Việt Nam" được nghiên cứu tại Trường Đại học Bách Khoa -

Hà Nội Luận văn trình bày tổng quan về âm thanh, các công nghệ xử lý âm thanh số, giới thiệu một cách sâu sắc các tiêu chuẩn phát thanh số đã triển khai và thử nghiệm trên thế giới Thông qua các tiêu chí, quan điểm đánh giá đưa ra đề xuất tiêu chuẩn phát thanh số mặt đất trong điều kiện của Việt Nam

Âm thanh số với độ méo tín hiệu nhỏ, dải động âm thanh lớn, đáp tuyến tần số bằng phẳng, tìm kiếm dữ liệu nhanh chóng dễ dàng, ghi âm số nhiều lần mà chất lượng không suy giảm, lưu trữ số và các hệ thống sản xuất chương trình audio dựa trên máy tính tỏ ra rất hiệu quả Được kết hợp với kỹ thuật nén, audio số có nén lại càng có nhiều ưu điểm hơn như tiết kiệm bộ nhớ, tiết kiệm kênh truyền…Hệ thống thông tin chỉ cần truyền tải tín hiệu âm thanh tại đầu vào với độ chính xác vừa đủ để cho phép đầu thu có khả năng tái tạo lại tín hiệu ban đầu

Phát thanh số làm nâng cao chất lượng chương trình, giảm chi phí khai thác, tăng nguồn thu dịch vụ gia tăng; nâng cao hiệu quả sử dụng phổ tần số

vô tuyến điện Do đó chuyển sang phát thanh số là một xu thế tất yếu của thế giới Hiện nay trên thế giới đang tồn tại nhiều nhiều tiêu chuẩn phát thanh số, mỗi tiêu chuẩn có đặc điểm và phạm vi ứng dụng khác nhau như tiêu chuẩn EUREKA147 ở châu Âu, DMB ở Hàn Quốc, ISDB-T ở Nhật Nhiều nước châu Âu, châu Á đang hoàn thành giai đoạn thử nghiệm DAB để có thể đưa phát thanh số vào khai thác trên diện rộng Luận văn cũng xem xét, đánh giá những đặc điểm cơ bản và các ưu nhược điểm của các tiêu chuẩn từ đó đưa ra

đề xuất lựa chọn tiêu chuẩn phát thanh số mặt đất ở Việt Nam

Trang 4

THESIS SUMMARY

My thesis is “DAB - Application and deployment in distant future

in Vietnam”, studied at Ha Noi University of Technology The thesis

presents an overview about audio and digital audio processing technologies; analyses DAB standards tested and deployed in the world and suggests a DAB standard suitable to Vietnam conditions

The advantages of digital audio can be summed up as follows: little signal deformation, wide audio dynamic range, searching databases easily and quickly, better copyability and storing digitals and program producing system based on the computer efficiently Compressed digital audio can save transmission channel and memory by combining with compressed technology… System only need transmiss audio signals at the input with enough accuracy to receiver to recreate the original signals

DAB improves the quality of programs, reduces operation cost, increases more profits from adding services and improves the efficiency of using frequency range Therefore, changing to using DAB is an indispensable trend in the world Nowadays, there are many DAB standards in the world Features and application scope of each is different such as EUREKA147 in Europe, DMB in Korea, ISDB-T in Japan Many countries in Europe and Asia are trying to complete DAB testing stage in order to deploy DAB on wide scale The thesis also considers and appreciates the basic features, advantages and disadvantages of each DAB standard, from this giving the suggestion to choose a suitable DAB standard in Vietnam

Trang 5

MỤC LỤC

Danh mục cỏc ký hiệu và chữ viết tắt 5

Danh mục cỏc hỡnh vẽ và bảng biểu 7

Lời núi đầu 9

1 Tổng quan về phát thanh số 11

1.1 - Âm thanh và đặc tính của âm thanh 11

1.1.1 - Sóng âm 11

1.1.2 - Sự cảm nhận của thính giác 12

1.2 - Số hóa tín hiệu audio 14

1.2.1 - Biến đổi ADC 16

a Lấy mẫu 16

b Lượng tử hóa 18

c Mã hóa 21

d Dither 23

e Dải động 24

f Tần số lấy mẫu chuẩn 24

g Chức năng tiền nhấn 25

1.2.2 - Biến đổi DAC 25

a Hiệu ứng méo độ nở 26

b Lọc thông thấp 27

c Lấy mẫu ở tần số cao 27

d Tạo dạng nhiễu 30

e Hạn chế của ADC/DAC 31

1.3 - Nén audio số 32

1.3.1 - Cơ sở của nén dữ liệu audio 32

1.3.1.1 - Mô hình tâm lý thính giác 33

Trang 6

1.3.1.2 - Sự che lấp tín hiệu audio 33

1.3.2 - Kỹ thuật giảm dữ liệu audio 36

1.3.2.1 - Giảm dữ liệu không tổn thất 36

1.3.2.2 - Giảm dữ liệu có tổn thất 38

1.3.2.3 - Quá trình mã hóa audio 38

a Filter band 39

b Mô hình cảm thụ, đồ thị mặt nạ và vị trí bit 41

c Bộ tạo thang độ và bộ lượng tử hóa 42

d Ghép kênh dữ liệu 43

1.4 - Tiêu chuẩn mã hóa audio 43

1.4.1 - Tiêu chuẩn nén AC3 43

1.4.2 - Tiêu chuẩn nén ATTRAC 45

1.4.3 - Tiêu chuẩn nén MPEG-1 49

a Layer I 51

b Layer II 52

c Layer III 53

1.4.4 - Hệ thống MPEG 2 cho audio 54

2 Các tiêu chuẩn PTS đã triển khai và đang thử nghiệm trên thế giới 57

2.1 - Tình hình nghiên cứu và phát triển phát thanh số 57

trên thế giới và khu vực Châu á - Thái Bình Dương

2.2 - Tiêu chuẩn EURKA-147 62

2.2.1 - Các đặc điểm cơ bản 62

2.2.2 - Mã hóa và chèn theo thời gian 63

2.2.3 - Điều chế OFDM và các chế độ truyền dẫn 63

2.2.4 - Thiết lập mạng 64

2.3 - Tiêu chuẩn WORLDSPACE 65

2.4 - Tiêu chuẩn IN-BAND/ON-CHANEL 66

2.5 - Tiêu chuẩn DIGITAL AM 68

2.6 - Tiêu chuẩn BST-OFDM ISDB 72

Trang 7

2.7 - Tiêu chuẩn DRM 74

2.8 - Tiêu chuẩn DMB 74

3 Nghiên cứu khả năng ứng dụng và triển khai 76

công nghệ phát thanh số mặt đất ở Việt Nam 3.1 - Tình hình phủ sóng phát thanh tại Việt Nam 76

3.2 - Đánh giá và đề xuất lựa chọn tiêu chuẩn phát thanh số 76

cho tiếng nói Việt Nam 3.2.1 - Tiêu chí, quan điểm đánh giá 77

3.2.2 - Đánh giá và đề xuất lựa chọn tiêu chuẩn 78

Kết luận 86

Tài liệu tham khảo 87

Phụ lục 88

Túm tắt luận văn 93

Trang 8

Lời nói đầu

Ngành phát thanh của Việt Nam đã phát triển và hình thành một mạng lưới các đài phát thanh từ trung ương tới địa phương đáp ứng được nhiệm vụ chính trị, xã hội, văn hoá Diện tích phủ sóng và chất lượng thu về cơ bản đã

đáp ứng được yêu cầu thực tế Tuy nhiên với công nghệ phát thanh analog việc phát triển ngành để đáp ứng kịp nhu cầu phát triển của xã hội sẽ gặp một vài khó khăn trở ngại như: Chi phí cho việc mở rộng vùng phủ sóng (tăng từ 87% hiện nay lên 100%) sẽ rất tốn kém, mở thêm chương trình cần đầu tư thêm mạng phát sóng, truyền dẫn tín hiệu, kinh phí đầu tư lớn Trong khi nhu cầu cần tăng thêm chương trình là rất cần thiết Chi phí khai thác mạng phát sóng rất cao, chủ yếu do điện năng tiêu thụ Chất lượng thu bị han chế do hiện tượng pha đinh, nhiễu đa đường

Công nghệ phát thanh số và việc triển khai phát thanh số thay cho phát thanh tương tự đã được áp dụng ở nhiều nơi trên thế giới từ cách đây hơn 10 năm Tuy vây, đối với nước ta để đưa ra kiến nghị lựa chọn bộ tiêu chuẩn phát thanh số và lộ trình phát triển phát thanh số cho Tiếng nói Việt Nam, cần tiến hành nghiên cứu nắm vững các tiêu chuẩn phát thanh số hiện tại kết hợp xem xét nhiều yếu tố ảnh hưởng khác như: xu thế phát triển phát thanh số trên thế giới và trong khu vực, chiến lược phát triển kinh tế xã hội của Việt Nam, của ngành phát thanh Việt Nam và của các ngành có liên quan ( viễn thông, truyền hình, công nghiệp điện tử…), khả năng phục vụ, các tiêu chí về kinh tế, kỹ thuật ( điều kiện địa hình phủ sóng, khả năng tận dụng cơ sở hạ tầng sẵn có, phổ tần số sử dụng, phạm vi áp dụng, chính sách phủ sóng, giá thành máy thu…) Chuyển sang phát thanh số là xu thế tất yếu của thế giới Việt Nam không thể là một ngoại lệ Lý do chính là vì phát thanh là cầu nối giữa các quốc gia, là phương tiện nghe thống nhất và phổ cập trên toàn cầu Bên cạnh

đó, phát thanh số có những ưu điểm là nâng cao chất lượng chương trình, giảm chi phí khai thác, tăng nguồn thu dịch vụ gia tăng; nâng cao hiệu quả sử dụng

Trang 9

phổ tần số vô tuyến điện Giải pháp về công nghệ lại đa dạng và đang phát triển …Nhưng để đảm bảo cho việc triển khai phát thanh số thành công ở Việt Nam thì việc lựa chọn một bộ tiêu chuẩn hợp lý là rất cần thiết

Với những lý do trên, tôi chọn đề tài “Công nghệ phát thanh số - ứng dụng và triển khai trong tương lai ở Việt Nam” nhằm mục đích tìm hiểu, nghiên cứu công nghệ phát thanh số và đưa ra được mô hình triển khai cho phát thanh Việt Nam

Luận văn được trình bày gồm 3 chương với nội dung như sau :

- Chương 1: Giới thiệu tổng quan về phát thanh số

- Chương 2: Các tiêu chuẩn phát thanh số đã triển khai và đang thử nghiệm trên thế giới

- Chương 3: Nghiên cứu khả năng ứng dụng và triển khai công nghệ phát thanh số cho Việt Nam

Tôi xin bày tỏ lòng cảm ơn sâu sắc tới TS Phạm Văn Bình đã tận tình hướng dẫn tôi nghiên cứu, tìm hiểu và tạo mọi điều kiện để tôi có thể hoàn thành luận văn tốt nghiệp

Do hạn chế về thời gian và kiến thức, luận văn tốt nghiệp của tôi còn rất nhiều thiếu sót Kính mong nhận được sự đóng góp ý kiến của thầy cô và các bạn để đề tài của tôi được hoàn thiện hơn

Xin trõn trọng cảm ơn

Hà nội, ngày 5 thỏng 10 năm 2008

Học viờn

Đỗ Thị Phượng Uyờn

Trang 10

Chương 1

Tổng quan về phát thanh số

Trên thế giới hiện nay đang tồn tại rất nhiều tiêu chuẩn phát thanh số và

được phát sóng truyền dẫn dưới nhiều hình thức khác nhau: Phát sóng qua vệ tinh, truyền dẫn qua cáp, truyền dẫn qua Internet và phát sóng mặt đất nhằm phục vụ người nghe sử dụng các hình thức thu đa dạng như: các máy thu cố

định, di động, trên ôtô… với các chương trình có chất lượng cao Việc lựa chọn truyền dẫn dưới hình thức nào còn tuỳ thuộc vào các điều kiện: địa hình, phân

bố dân cư, điều kiện kinh tế, điều kiện xã hội… Tuy nhiên dù theo tiêu chuẩn nào và truyền dẫn dưới hình thức nào thì khởi đầu cho phát thanh số vẫn là kỹ thuật chuyển đổi các tín hiệu âm thanh tương tự thành âm thanh số Chương 1

sẽ trình bày tổng quan về âm thanh, kỹ thuật xử lý âm thanh số, nén tín hiệu

âm thanh số để làm cơ sở cho việc xây dựng nội dung của các chương tiếp theo

1.1 - âm thanh và đặc tính của âm thanh

1.1.1 - Sóng âm

Khi một vật dao động về một phía nào đó, nó làm cho các lớp không khí liền trước bị nén lại, và lớp không khí liền sau dãn ra Sự nén và dãn không khí như vậy lặp đi lặp lại một cách tuần hoàn nên đã tạo ra trong không khí một sóng đàn hồi Sóng này truyền tới tai, nén vào màng nhĩ khiến cho màng nhĩ cũng dao động với cùng tần số Khi màng nhĩ dao động, các vị trí phân biệt của màng nhĩ trên bề mặt giống như nó chuyển động về trước hay sau đáp ứng với các sóng âm vào Khi cùng một thời điểm, ta nghe thấy nhiều âm, thì mọi

âm thanh phân biệt này được trộn với nhau một cách tự nhiên trong tai giống như một hình mẫu đơn của áp suất không khí thay đổi Tai và óc làm việc cùng nhau để phân tích tín hiệu này ngược lại thành những cảm giác về âm riêng biệt

Trang 11

• Thanh ỏp P: độ dao động ỏp suất của khớ quyển khi bị súng õm tỏc động, bằng ỏp suất tổng ở thời điểm hiện tại trừ đi ỏp suất tĩnh

đơn vị: Pascal (Pa)

• Mức thanh ỏp = bỡnh phương thanh ỏp, được dựng để chuẩn húa (20 mPa2) khi tớnh õm lượng theo đơn vị dB

• Mức õm thanh được tớnh theo đơn vị dB

- Sự biến đổi của mức õm theo thang loga phự hợp với tõm sinh lý con người

• Âm thanh bao gồm õm đơn và õm phức

Âm đơn : là õm được hỡnh thành tại một tần số theo dao động sin

Âm phức : là õm được hỡnh bởi nhiều tần số theo dao động sin

Tai người bình thường có thể nghe âm thanh trong phạm vi tần số 20Hz tới 15.000Hz, riêng lứa tuổi 18 có thể nghe đến 20.000Hz Âm có tần số dưới 20

Hz là hạ âm, trên 20.000Hz là siêu âm tai người không thể nghe thấy được Trong phạm vi tần số cảm thụ âm thanh nói trên độ nhạy cảm theo tần số cũng

Trang 12

kh¸c nhau §é nh¹y c¶m cao nhÊt cña tai n»m ë ph¹m vi tÇn sè tõ 1000Hz tíi 5000Hz vµ gi¶m dÇn ë tÇn sè thÊp

H×nh 1.1 : C¬ quan thÝnh gi¸c

• Cảm nhận về tần số: là sự cảm nhận về độ cao của âm

Quy luật: Khi tần số tăng lên gấp 2 lần thì cảm nhận sự thay đổi của độ cao

của âm là tương đương

• Cảm nhận về biên độ : là sự cảm nhận về độ to của âm

Quy luật: Khi âm lượng tăng lên gấp 10 lần thì cảm nhận sự thay đổi của độ

to của âm là tương đương

- Ngưỡng nghe được: Cường độ âm lớn nhỏ nhất mà tai người có thể cảm thụ được Phân biệt có âm thanh tồn tại hay không Giá trị : 0 dB

- Ngưỡng chói tai: Cường độ âm lớn nhất mà tai người còn cảm thụ được

Ngưỡng phân biệt âm thanh có làm tổn thương cơ quan thính giác hay không Giá trị : 120 dB

• Hiệu ứng che lấp là hiệu ứng làm thay đổi ngưỡng nghe thấy do tác động của nguồn âm khác (nhiễu)

Mức che lấp là khoảng dịch chuyển ngưỡng nghe thấy khi có và không có tác động che lấp Các yếu tố ảnh hưởng : Thời gian, Tần số, Mức, Đặc tính của

âm thanh

Trang 13

• Hiệu ứng stereo

Monophonic : nguồn đơn

Stereophonic tạo hiệu ứng về mặt khụng gian qua cảm nhận 3 thuộc tớnh của nguồn õm để định vị nguồn õm về mặt khụng gian:

- Biờn độ : hướng tỷ lệ với độ lớn tương đối cảm nhận giữa 2 tai

- Pha : hướng của nguồn õm

- Thời gian : khoảng cỏch tỷ lệ với thời gian truyền õm

1.2 - số hóa các tín hiệu audio

Xử lý tín hiệu âm thanh theo công nghệ số có rất nhiều ưu điểm như:

- Ưu điểm nổi bật của âm thanh số là nhiễu không thể xâm nhập được vào tín hiệu

- Cải thiện tỷ số tín hiệu/ tạp âm

- Việc tìm kiếm dữ liệu nhanh chóng, dễ dàng

Từ những năm 80, thiết bị audio số đã dần thay thế thiết bị audio tương

tự trong sản xuất chương trình và phát sóng Ưu điểm nổi bật là ghi âm số nhiều lần mà chất lượng không suy giảm, lưu trữ số và các hệ thống sản xuất chương trình audio dựa trên cơ sở máy tính tỏ ra rất hiệu quả Công nghệ số cho phép ghi, xử lý, truyền dẫn phát sóng và thu thanh hoàn toàn trong môi trường số

Để thiết bị số có thể hoạt động, tín hiệu audio tương tự phải được chuyển thành tín hiệu audio số (ADC) Xử lý audio số sẽ có giá trị , nếu quá

Trang 14

trình ADC không gây giảm chất lượng và phải có các định dạng số thích hợp cho ghi âm và truyền dẫn

Về cơ bản, âm thanh tương tự và số là khác nhau, nên ta luôn bị mất thông tin khi làm phép chuyển đổi giữa chúng Khi được số hoá, sóng âm thanh được biểu diễn như là một chuỗi các số (được gọi là các mẫu), mà chúng biểu diễn áp suất không khí hay tín hiệu điện tại các thời điểm kế tiếp nhau theo thời gian Khi mẫu hoá một tín hiệu tương tự, ta luôn gặp phải 2 vấn

đề: thứ nhất, mỗi giá trị kế tiếp trong dạng biểu diễn dạng số là một quãng xác

định nào đó của thời gian, và mỗi khối có một độ rộng xác định; thứ hai là các

số số hoá là rời rạc Chỉ có một số xác định các độ cao có thể cho mỗi khối Theo hình vẽ, ta thấy độ cao các khối không ăn khớp với đường tín hiệu gốc

Tín hiệu tương tự Tín hiệu số

Hình 1.2: Chuyển đổi tín hiệu sang dạng các mẫu số

Đây là hai lỗi cơ bản trong tín hiệu âm thanh số Lỗi này có thể được kiểm soát bằng cách thay đổi khuôn dạng chi tiết của dạng biểu diễn âm thanh, nhưng không thể loại bỏ được hoàn toàn Chính vì vậy, tuỳ theo ứng dụng ta sẽ phải chấp nhận một số lỗi nhất định Và các hệ số khác như kích thước dữ liệu hay tần số xử lý yêu cầu ta phải chấp nhận một sai số lớn hơn từ một số nguồn để có thể giảm hơn nữa các sai số khác

Microphone và loa là các linh kiện tương tự, hoạt động với các tín hiệu tương tự Vì vậy các tín hiệu điện liên tục theo thời gian phải được chuyển đổi

Trang 15

thành các định dạng số rời rạc theo thời gian dùng cho xử lý số tín hiệu Bộ biến đổi ADC có ảnh hưởng lớn đến chất lượng audio số Quá trình chuyển

đổi tín hiệu tương tự sang số bao gồm các bước sau:

• Lọc tín hiệu nhằm mục đích hạn chế băng tần

• Lấy mẫu (rời rạc hoá tín hiệu theo thời gian)

• Lượng tự hoá (chuyển đổi giá trị liên tục của tín hiệu thành giá trị rời rạc theo biên độ)

• Mã hoá (gán giá trị nhị phân cho các mẫu)

a/ Lấy mẫu

Nguyên tắc lấy mẫu:

Theo định lý Nyquist : Để chuyển đổi một tín hiệu tương tự thành tín hiệu

số, thì tín hiệu tương tự cần thiết phải được lấy mẫu trước tiên, ở những điểm nhất định về thời gian giá trị mẫu tín hiệu vào này cần được lấy mẫu Khoảng thời gian cố định giữa mỗi mẫu được gọi là khoảng lấy mẫu ( ts)

Hình 1.3: Quá trình chuyển đổi tín hiệu liên tục

Định lý lấy mẫu hoàn toàn đơn giản, tần số lấy mẫu fs lớn hơn hoặc bằng hai lần tần số cực đại của tín hiệu tương tự gốc : fs ≥ 2fmax

Quá trình lấy mẫu thực hiện việc phân tích tín hiệu audio tương tự với chuỗi xung có thời gian lặp lại với tần số lấy mẫu Đó lá quá trình điều biên xung (PAM) trong miền thời gian ( hình 1.4), và trong miền tần số (hình 1.5)

Theo định lý Nyquist, với fs≥ 2fmax (fs - tần số lấy mẫu, fmax - tần số audio cực

đại) thì các biên phụ không chồng lên nhau, không có hiện tượng chồng phổ (hình 1.6)

Trang 16

Trước khi thực hiện biến đổi ADC, phải hạn chế phổ tần số audio đến giá trị nhỏ hơn 1/2fs

Hình 1.4: Quá trình lấy mẫu (PAM) trong miền thời gian

Hình 1.5: Phổ điều chế với các biên phụ (fs= fmax) xung quanh

tần số lấy mẫu trong miền tần số

Hình 1.6: Hiện t-ợng chồng phổ

Biờn độ

Thời gian Tớn hiệu Audio

Xung lấy mẫu

Phổ tần số lấy mẫu

Điều biờn

Tớn hiệu Audio lấy mẫu

f s – f max f s + f max

f s 2f s

Trang 17

Xung lấy mẫu phải có số thời gian hẹp, bằng một chu kỳ lấy mẫu (1/fs).Trong thực tế bộ ADC, giá trị biên độ xung của mỗi mẫu được giữ cho

đến khi nào đạt mẫu tiếp theo (hình 1.7)

Hình 1.7: Quá trình lấy mẫu và giữ (sampling-and-hold) trong miền thời gian

b/ Lượng tử hoá

Sau quá trình lấy mẫu tín hiệu vẫn còn là tương tự, quá trình chuyển thành tín hiệu số thực sự diễn ra ở bước lượng tử hóa này - Quantizing (hình1.8a) Đây chính là quá trình chuyển đổi từ giá trị điện áp sang dạng giá

trị số tương ứng.Trong một hệ thống, dải tín hiệu tương tự được chia thành một số vùng, và những mẫu tín hiệu được gán một giá trị nhất định Những giá trị này được biểu thị dưới dạng nhị phân, với số dương được biểu thị bằng mã nhị phân tự nhiên còn với số âm thì biểu thị bằng mã dương cộng thêm số

1 Trong hệ thống như vậy , bit mang ý nghĩa nhiều nhất MSB được dùng như

là bit dấu , nó là “0” với những giá trị dương, là “1” với những giá trị âm Những vùng trong đó tín hiệu được chuyển đổi gọi là khoảng lượng tử, biểu thị bằng chữ Q Một dãy n bit biểu thị cho giá trị điện áp tương ứng với khoảng lượng tử gọi là từ mã

Quá trình lượng tử hoá có các đặc điểm sau đây:

Biờn độ

Thời gian Tớn hiệu Audio

Xung lấy mẫu

Thời gian

Điều biờn

Tớn hiệu đó lấy mẫu

Thời gian

Trang 18

• Khoảng giá trị nhị phân không đối xứng với các chuyển dịch dương và

âm của tín hiệu audio gốc

• Tín hiệu tương tự có biên độ thấp được lượng tử hoá với rất ít mức rời rạc Việc này gây ra sai số lượng tử Muốn giảm sai số lượng tử phải tăng số mức rời rạc Hệ thống 5 bit sẽ giảm khoảng lượng tử hoá xuống còn 1/2 so với

hệ thống 4 bit Bộ lượng tử hoá 16 bit có thể làm tăng 65.535 (216-1) khoảng lượng tử Một phương pháp khác giảm sai số lượng tử hoá là tăng tần số lấy mẫu ( oversampling – lấy mẫu cao)

Hình 1.8: Quá trình lấy mẫu và sai số l-ợng tử hoá trong ADC 4 bit

• Nếu biên độ tín hiệu audio tương tự vượt quá khoảng lượng tử hoá thì sẽ xảy ra cắt số (digital clipping)

Theo nguyên tắc lượng tử , do các điện áp trong khoảng lượng tử được đại diện bằng một mức trung bình nên quá trình lượng tử là quá trình không tuyến tính và có thể tạo ra lỗi , các lỗi này gọi là lỗi lượng tử Sai số lượng tử hoá phụ thuộc vào tín hiệu: Nếu nhiễu nhẹ tồn tại trong tín hiệu gốc, thì nó sẽ

Thời gian Biờn độ

1/f s

a) Thời gian lấy mẫu và giỏ trị

lượng tử hoỏ 4 bit

Trang 19

cộng vào các thành phần ngẫu nhiên Sai số lượng tử hoá có thể coi như là nhiễu cộng vào tín hiệu gốc và làm cho chất lượng âm thanh thô hơn

Tỷ số tín hiệu trên nhiễu (SNR) là tỉ số tín hiệu dạng sine cực đại (dưới mức cắt) trên giá trị RMS (căn bình phương trung bình) của sai số lượng tử hoá (e) Với ADC n - bít, một nửa các khoảng lượng tử hoá 2n-1 được dùng cho một cực tính của sóng sine Giá trị sóng sine với RMS cực đại được tính như

sau:

2

.

2 1Q V

n

( Q: khoảng lượng tử hoá, 2n-1: 1/2 số khoảng lượng tử hoá 2n)

Các tín hiệu audio có phổ rộng và các giá trị biên độ cao sẽ tạo sai số lượng tử hoá có xác suất bằng nhau với bất kỳ một giá trị nào giữa : +Q/2 và - Q/2 Cho nên có các giá trị ngẫu nhiên Q trong một khoảng lượng tử hoá và xác xuất cho mỗi giá trị bằng 1/Q Giá trị RMS của nhiễu lượng tử được biểu diễn bằng căn bình phương trung bình của tổng các sai số bình phương:

Tổng sai số trung bình bình phương: +∫

2 /

2 / 2

Q

Q de e

Trung bình của tổng : +∫

2 /

2 / 2

1 Q

Q de e Q

Căn bình phương trung bình:

Điện áp nhiễu = ∫

2 /

2 / 2

1 ) (

Q

Q

de e Q

c/ Mã hoá

Trang 20

Mỗi giá trị lượng tử hoá nhị phân cần phải được mã hoá để phù hợp với loại tín hiệu lấy mẫu, truyền dẫn và ghi âm Hệ thống mã hoá thường dùng là PCM ( điều xung mã), PWM (điều chế theo độ rộng xung), ADM (điều chế dữ liệu thích nghi), DPCM (điều chế xung mã vi sai), FP - điểm di động (floating point)

PCM ít hiệu quả, nhưng đơn giản PCM được thực hiện tuyến tính cho tất cả các khoảng lượng tử hoá Tất cả các mức lượng tử hoá được gán bằng các từ mã theo một trật tự logic

PAM (Pulse Amplitude Modulation)

Trong thực tế, các bộ chuyển đổi DAC và ADC thường xuyên sử dụng dạng PAM - điều chế biên độ xung, như một khuôn dạng trung gian, trong đó

âm thanh được coi như một chuỗi các xung, và biên độ của mỗi xung (độ cao) biểu diễn độ mạnh của âm thanh tại điểm đó

Tín hiệu tương tự Xung PAM

Hình 1.9: PAM

PWM (Pulse Width Modulation)

Ngoài ra, ta còn dạng biểu diễn khác là PWM - điều chế độ rộng xung, cũng giống như PAM, đây là dạng biểu diễn mỗi mẫu như một xung, nhưng

nó sử dụng độ rộng hay khoảng kéo dài của xung (thay cho biên độ) để biểu diễn độ mạnh của âm thanh

Trang 21

Tín hiệu tương tự Xung PWM

Hình 1.10: PWM

PCM (Pulse Code Modulation)

Đây là dạng biểu diễn mỗi mẫu như một chuỗi các xung, mà các xung

đó biểu diễn mã nhị phân của nó Nhưng biểu diễn dạng này rất khó xác định

đâu là điểm bắt đầu và kết thúc của mỗi mã Tuy nhiên, không khó khăn để có thể khắc phục điều này, ví dụ như ta có thể xây dựng các mã theo một dạng riêng để không có mã nào chứa 3 số 1 liên tiếp (111) và sau đó chèn 111 vào tín hiệu tại điểm bắt đầu của mỗi mã Trong bộ nhớ máy tính, các mã nhị phân liên tiếp được lưu trữ như các số Thông thường, dữ liệu âm thanh dạng PCM

được lưu trữ với 8 hay 16 bits mỗi mẫu

Tín hiệu tương tự Xung PCM

Hình 1.11: PCM

d/ Dither

Trang 22

Dùng kỹ thuật Dither để giảm méo lượng tử hoá các tín hiệu có mức thấp

Kỹ thuật Dither cộng nhiễu trắng vào tín hiệu (giá trị RMS của nhiễu trắng nhỏ hơn 1/3 khoảng lượng tử hoá) Khi biến đổi ngược lại thành tương tự, tín hiệu khôi phục không có liên quan với tín hiệu gốc Tuy nhiên, mạch lọc thông thấp khôi phục tín hiệu lấy trung bình tín hiệu theo thời gian; nhiễu

được tách ra và tín hiệu gốc được khôi phục xấp xỉ

Hình 1.12: Dither hoá tín hiệu vào có mức thấp.

e/ Dải động

Q/2

Q Q/2

Đầu ra lượng tử hoỏ

Trang 23

Hình 1.13: Mã hoá 20-bit nhị phân (giá trị 1 và 0)

Mức tín hiệu audio đạt cực đại trước khi cắt mã số lớn nhất mà bộ ADC

có thể cho (hình 1.13) Mức này tương đương mức 0dB FS (thang độ đầy đủ)

và tất cả các mức số được chuẩn theo điểm này là các giá trị âm Mức cực tiểu

được đặt bằng nhiễu Dither (-120 dBFS cho ADC 20bit) Do đó, dải động là 120dB

f/ Tần số lấy mẫu chuẩn:

Hiện nay, thông thường dùng 3 tần số lấy mẫu chuẩn:

• 32 KHz (tiêu chuẩn chuyên dụng): Dùng trong truyền dẫn đến máy phát thanh FM Stereo

• 44,1 KHz (tiêu chuẩn dân dụng): Dùng trong máy ghi hình Umatic, CD, R-DAT (chỉ phát lại)

• 48 KHz (tiêu chuẩn phát thanh): Có thể dùng với băng tần audio tương

tự lên đến 22 kHz

g/ Chức năng Preemphasis (tiền nhấn):

Giới hạn tớn hiệu dương max MSB

(Hex)

Trang 24

Kỹ thuật Preemphasis (tiền nhấn) và deemphasis (giải nhấn) được dùng trong ghi âm và phát lại Nó làm giảm nhiễu lượng tử hoá ở vùng tần số cao Cần lưu ý là chức năng này được dùng trong máy ghi âm với tín hiệu audio vào là tương tự Đối với máy ghi âm số có tín hiệu vào số thì không cần dùng chức năng này.

1.2.2 - Biến đổi DAC

Quá trình của bộ biến đổi ngược (số ra tương tự - DAC) bao gồm:

• Giải mã các từ mã nhị phân

• Biến đổi ngược thành điện áp, biểu diễn các tín hiệu audio gốc

Hình 1.14 là mạch DAC có độ phân giải n-bit Dữ liệu n-bit điều khiển n

chuyển mạch (vị trí ON và OFF ứng với giá trị 0 và 1 của tín hiệu số) Các vị trí chuyển mạch cho giá trị điện áp V ở đầu ra tỉ lệ với các bit trong từ mẫu Dạng tín hiệu ra của DAC được cho trong hình 1.15.

Hình 1.14 : Mạch DAC có độ phân giải n-bit

0

2 2 2 2 2 2

bit 0 bit 1 bit 2 bit 3 bit 4 bit n-1

1 0 1 1 0 0 MSB

- +

LSB

Nguồn điện

áp chuẩn

Biờn độ Biờn độ

Trang 25

Hình 1.15: Dạng tín hiệu ra của DAC

a/ Hiệu ứng aperture- hiệu ứng méo độ mở

Phổ tín hiệu lấy mẫu được điều chế biên độ với tín hiệu có đường bao dạng sinx/x Đường bao của hàm sinx/x biến đổi theo độ rộng xung lấy mẫu tại tần số cao Nếu xung có độ rộng gần bằng 0, thì quá trình lấy mẫu là lý tưởng (sinx/x=1) và không có thay đổi ở tần số cao Sự thay đổi tăng theo độ rộng xung lấy mẫu; Hiện tượng này gọi là hiệu ứng thời gian aperture

Tỉ lệ: aperture =

s

T

Với: t- thời gian xung lấy mẫu Ts- chu kỳ lấy mẫu

Với tỷ lệ aperture bằng 1 (100%), độ suy giảm 4 dB tại 1/2 fs Nếu tỷ lệ aperture giảm xuống 12,5%, thì độ suy giảm còn 0,2 dB, nhưng biên độ của các biên phụ tăng

Trang 26

b/ Lọc thông thấp

Bộ lọc thông thấp (khôi phục tín hiệu) loại bỏ các hài bậc cao (trên fs/2)

được hình thành trong quá trình lấy mẫu Bộ lọc loại bỏ các thành phân tần số cao chứa trong các tín hiệu bậc thang (hình1.15c)

c/ Lấy mẫu ở tần số cao

Lấy mẫu ở tần số cao (over samling) được dùng cho ADC và DAC nhằm nâng cao chất lượng (giảm méo lượng tử và thành phần chồng phổ)

Với sự thay đổi lớn biên độ tín hiệu audio tương tự (lấy mẫu tần số cao), các mức lượng tử hoá rời rạc phụ được cộng vào, kết quả làm giảm sai số lượng tử hoá

Nếu lấy mẫu tần sỗ cao cho ADC có độ phân giải cao, ví dụ 18 bit, thì phải chia khoảng lượng tử 16 bit thành 4 khoảng Sử dụng độ phân giải của ADC cao hơn (>18 bit) sẽ làm giảm sai số lượng tử hoá 4 lần và nâng cao khả năng tạo lại các tín hiệu mức thấp của hệ thống

Với hệ thống dùng tần số lấy mẫu gấp 2 lần thì phổ của nhiễu lượng tử sẽ tăng trên 2 lần so với độ rộng băng tần thông thường và tỉ số SNR tăng lên 3

dB Tỉ số SNR đối với một tín hiệu sin được tính như sau:

SNR (dB) = 6,02n + 1,76 + 10log10d (1.6) Trong đó:

n – số bit/mẫu lượng tử hoá

d – hệ số lấy mẫu tần số cao

Vd : Với tần số lấy mẫu tăng 4 lần thì SNR tăng 6 dB

Hình 1.16 là sơ đồ khối của hệ thống ADC và DAC với tần số lấy mẫu

gấp 4 lần

Mạch lọc số dùng cho ADC/DAC nhằm loại bỏ các thành phần tần số không mong muốn trong phổ tín hiệu trước bộ DAC, và để tiết kiệm các mạch lọc chống chồng phổ (điểm cắt sắc nét) và mạch lọc khôi phục

Mạch lọc số có các hoạt động như nhân, làm trễ, cộng các số nhị phân có

độ chính xác cao, dễ thực hiện

Trang 27

Hình 1.16: Hệ thống ADC/DAC với tần số lấy mẫu gấp 4 lần

Số phần tử trễ quyết định bậc của mạch lọc số Bậc càng cao thì có khả năng tạo các dạng đặc tuyến cắt càng sắc nét mà không gây méo pha Hình 1.17 là ví dụ mạch lọc số dùng tần số lấy mẫu gấp 4 lần Mỗi tế bào D là một

dây trễ (giống như một bộ ghi - dịch) Mỗi mẫu có trễ được nhân với các hệ số (nhân với X1,, X2,…, Xn), kết quả được cộng lại trong bộ cộng nhị phân

LPF

Biến đổi 4f s ->fs

Lọc số LPF Biến đổi

Fs->4f s

DAC Loc tương

Trang 28

a) Lọc ngang bậc n, dùng trong lấy mẫu với tần số cao gấp 4 lần

b) Đáp tuyến của xung lấy mẫu tại đầu ra bộ lọc số

c) Đáp ứng lọc số có trễ và tổng lại tần số lấy mẫu chuẩn Hình 1.17: Mạch lọc nối tiếp ngang (transversal filter) dùng trong ADC/DAC

có tần số lấy mẫu gấp 4 lần

Tần số tổng cộng ở đầu ra tăng gấp 4 lần (192kHz) Phổ tín hiệu lấy mẫu

được cho trong hình 1.18 Tín hiệu gốc được lấy mẫu tại 48 kHz, tất cả các

phổ xung quanh 48, 96, 144 kHz được loại bỏ bằng mạch lọc số nối tiếp dùng

tần số lấy mẫu gấp 4 lần, nhiễu lượng tử hoá trải phổ trong băng tần bằng 4fs/2

Biờn độ Tớn hiệu audio

tương tự thấp tương tự Lọc thụng Lấy mẫu chuẩn 48kHz

Thời gian

Đầu ra theo mẫu đầu vào x

Thời gian Đầu ra theo mẫu

đầu vào x + 1

Trang 29

Hình 1.18: Phổ tín hiệu tại đầu ra mạch lọc số dùng tần số lấy mẫu gấp 4 lần

d/ Tạo dạng nhiễu (noise shaping)

Lấy mẫu tần số cao sẽ mở rộng khoảng tần số tín hiệu lấy mẫu, trải phổ của nhiễu lượng tử hoá trên vùng băng tần cơ bản Kỹ thuật dao động nhiễu sẽ giảm mức phổ nhiễu trong băng tần cơ bản tín hiệu audio, nhưng làm tăng mức phổ của nhiễu ngoài khoảng này Biên độ nhiễu được cố định, nhưng phổ của nó đã thay đổi Ta có thế giảm nhiễu audio một cách đáng kể, nếu dùng cách lọc bậc 2 hoặc 3 để tạo dạng nhiễu

a) ADC với lấy mẫu tần số cao gấp 4 lần và vòng phản hồi

Tạo dạng/

tớch phõn nhiễu

Lọc số LPF

Biến đổi 4f s → f s

Thời gian

Hàm truyền tớn hiệu vào

Hàm truyền nhiễu lượng tử hoỏ (mạch lọc bậc 1) Biờn độ

f s /2

Trang 30

b) Phổ của tín hiệu audio t-ơng tự và tín hiệu nhiễu l-ợng tử hoá tại đầu ra ADC Hình 1.19: ADC dùng tần số lấy mẫu gấp 4 lần và vòng phản hồi tạo dạng nhiễu

Hình 1.19a là sơ đồ khối bộ ADC có tần số lấy mẫu tăng gấp 4 lần và

mạch phản hồi tạo dạng nhiễu Mạch phản hồi có hàm truyền đạt với đáp ứng phẳng cho tín hiệu vào tương tự ( ngoài vòng phản hồi) và hàm truyền đạt tích phân đối với tín hiệu nhiễu lượng tử đưa vào vòng phản hồi qua ADC

Hình 1.19b là phổ của tín hiệu tương tự vào và tín hiệu nhiễu lượng tử

e/ Hạn chế của ADC/DAC

Cả hai mạch ADC và DAC đều có gây sai số cho tín hiệu audio Nói chung các sai số này là nhỏ, nhưng nhiều lần đi qua ADC và DAC sẽ tích lại làm giảm chất lượng tín hiệu audio Có thể phân biệt sai số thành 2 nhóm:

- Nhiễu của bộ lọc thông thấp (LPF) Nếu một nhóm các tần số bị trễ hơn các nhóm khác trong phổ tín hiệu, thì sẽ xảy ra trễ nhóm Sai số trễ nhóm làm méo tín hiệu khôi phục Hơn nữa độ gọn của mạch lọc thông thấp khôi phục và chồng phổ có thể tích lại và tạo các sai số có biên độ đáng kể trong tín hiệu khôi phục Các sai số này có thể sửa bằng các mạch lọc số bậc cao

- Sai số biến đổi Các giá trị lượng tử hoá có sai số được hình thành, nếu tần

số lấy mẫu dạng chuông thay đổi, làm cho các vị trí và thời gian lấy mẫu không chính xác

1.3 - nén audio số

Do nhu cầu đòi hỏi phải ghi âm thanh trên các chất liệu ghi gọn nhẹ ngày càng lớn, nên bắt buộc những nhà sáng chế, nhà sản xuất nghĩ ra nhiều phương pháp ghi âm tiên tiến sao cho ghi được ngày càng nhiều âm thanh trên các định dạng ghi âm nhỏ gọn Việc nén tương tự cho phép làm giảm dải

động tín hiệu đáp ứng yêu cầu số hóa âm nhạc Theo những nghiên cứu y học hiện đại đã phát hiện ra rằng tai người rất nhạy cảm với một số tần số nhất

Trang 31

định, điều này dẫn tới một phương pháp mã hóa ” mã hóa âm thanh giác quan” Phòng thí nghiệm Dolby vào năm 1984 đã đưa ra phương pháp , gọi tắt

là AC-1, được dùng trong phát thanh Thế hệ tiếp theo là AC-2 , AC-3 được dùng cho trường quay và các sản phẩm hậu kỳ với tỉ lệ bit thấp và vì vậy hệ thống này được dành cho hệ thống phát thanh truyền hình Một bước đột phá thực sự của công nghệ này do Sony tạo ra đó là ATRAC ( Adaptive transform Acoustic Coding) Hệ thống này có tỉ lệ nén 5:1 nên có sự suy giảm tín hiệu rất ít và được Sony chọn dùng cho hệ thống mã hóa âm thanh vòm trong chiếu bóng cũng như trong định dạng ghi âm Minidisc

Tín hiệu Audio số PCM được dùng trong phát thanh, truyền hình, multimedia và nhiều ứng dụng khác (hệ thống nhiều đường audio, nhà hát tại nhà) Tín hiệu âm thanh Stereo có độ phân giải 16 bit, lấy mẫu tại 48 kHz, sẽ cho tốc độ dữ liệu audio là 1.54 Mb/s, còn hệ thống âm thanh tròn nhiều kênh

có tốc độ dữ liệu 4.5 Mb/s Do đó cần nén dữ liệu có hiệu quả để lưu trữ và phân phối kênh có độ rộng hẹp

Audio có nén được sử dụng trên CD-ROM, mạng phát thanh truyền hình

số qua vệ tinh DBS (Digital broadcast satellite) Các hệ thống nén thông tin

âm thanh dựa trên đặc trưng tâm sinh lý nghe và các giới hạn của tai người để loại bỏ các thành phần dữ liệu dư thừa trong tín hiệu audio

1.3.1 - Cơ sở của nén dữ liệu audio

Nén tín hiệu audio được thực hiện dựa trên cơ sở là mô hình tâm lý thính giác của con người, sự hạn chế về mặt cảm nhận và hiện tượng che lấp các thành phần tín hiệu âm thanh

1.3.1.1 - Mô hình tâm lý thính giác

Hệ thống thính giác của con người (Human Auditory System-HAS) có

đặc điểm như một bộ phân tích phổ Nó chia dải phổ âm thanh nghe thấy thành các băng tần gọi là các “ băng tới hạn”(critical bands) như một dãy các

bộ lọc thông dải Các băng này có bề rộng dải thông là 100 Hz với các tần số dưới 500 Hz và tăng theo tần số tín hiệu với các tần số lớn hơn 500 KHz Bề

Trang 32

rộng dải thông này tăng tới vài KHz khi tần số tín hiệu lớn hơn 10 KHz Có thể mô hình hoá hệ thống cảm nhận của con người bằng 26 bộ lọc thông dải liên tiếp có bề rộng dải thông như đã nói

Khi tín hiệu âm thanh bao gồm các tần số gần kề nhau, hệ thống thính giác của con người (HAS) sẽ tổ hợp chúng thành một nhóm có năng lượng cân bằng Ngược lại, nếu âm thanh bao gồm nhiều tần số khác biệt nhau, chúng sẽ

được xử lý tách biệt và độ lớn âm được xác định

Tính nhạy cảm của HAS giảm tại các tần số cao và tần số thấp Điều này

có nghĩa rằng đối với các mức âm thấp thì sự thay đổi trong cảm nhận của con người là rất quan trọng và sẽ giảm dần tại các mức âm cao

1.3.1.2 - Sự che lấp tín hiệu Audio

Hệ thống thính giác của con người còn có một đặc điểm vô cùng quan trọng, đó là tính che lấp “ masking” Có hai dạng che lấp, đó là : che lấp thời gian và che lấp tần số Tiến hành thực nghiệm đối với hệ thống thính giác, người ta đã xây dựng được đặc tuyến che lấp trong miền thời gian và trong miền tần số

bị biến đổi bởi âm che lấp

Kết quả

che lấp tạo bởi

Trang 33

Để tai người có thể nghe thấy, bất cứ một âm thanh ở tần số đơn nào cũng phải có mức áp suất âm lớn hơn một giá trị ngưỡng xác định Tập hợp tất cả các giá trị ngưỡng này đối với tất cả các âm đơn trong dải tần nghe được tạo nên một đường cong gọi là “ngưỡng nghe thấy tuyệt đối” (absolute hearing threshold), là đường đậm nét ở hình vẽ trên Tất cả các âm thanh nằm dưới đường cong này đều không có khả năng được con người cảm nhận

Do sự xuất hiện của một âm thanh có cường độ cao ở một tần số nào đó,

sẽ làm đường cong này biến đổi đi Trong ví dụ trên, âm 1-KHz với mức áp suất âm 45 dB đã làm ngưỡng nghe thấy tuyệt đối dâng lên 27dB Điều này có nghĩa những tạp âm dưới 27 dB là không nghe thấy Nếu sử dụng thang lượng

tử có 6dB/ bước nhảy thì chỉ cần 3 bít để mã hoá âm này vì giá trị vi sai ở đây là: 45-27 = 18 dB

Nếu mức âm 1-KHz tăng lên tới 65 dB thì mức che phủ sẽ tăng lên tới 55

dB, giá trị vi sai lúc này chỉ còn 10 dB và có thể được mã hoá chỉ bằng 2 bít Việc che phủ tần số trước và sau cũng rất quan trọng Như trên hình vẽ,

âm 1-KHz cũng làm ngưỡng nghe thấy của các âm tần số xung quanh dâng lên Sự che phủ tần số phía sau quan trọng hơn và tăng theo mức âm Điều này cho phép giảm độ chính xác mã hoá cho những tần số tín hiệu xung quanh âm

Trang 34

che phủ Những âm đơn tần xung quanh 1-KHz có mức âm nhỏ hơn đường cong che phủ sẽ không có khả năng cảm nhận và không cần thiết phải mã hoá

mà vẫn không làm ảnh hưởng tới chất lượng cảm nhận của con người Hệ thống nén dựa trên đặc điểm này được gọi là hệ thống nén theo thính giác

♦ Sự che phủ thời gian

Sự che phủ thời gian là hiện tượng tai người chỉ cảm nhận được âm sau khi âm

đó bắt đầu khoảng 200 ms và có cảm tưởng âm thanh còn kéo dài khoảng 200ms nữa sau khi âm thanh đã dứt Ngoài ra, thính giác cũng không phân biệt được khoảng ngừng nhỏ hơn 50 ms giữa hai âm thanh giống nhau đi liền nhau

1.3.2 - Kỹ thuật giảm dữ liệu audio

Kỹ thuật mã hoá nguồn được dùng để loại bỏ độ dư thừa của tín hiệu audio (nếu độ chênh lệch mẫu - đến - mẫu bằng 0) và kỹ thuật che mặt nạ tâm sinh lý nghe được dùng để nhận dạng và loại bỏ nội dung không thích hợp (các mẫu không phải là audio) Có 2 kỹ thuật nén dữ liệu chính sau đây:

50 100 150 200 300 -50 0

250

0

Tín hiệu che lấp

Hình 1.21 : Sự che lấp về thời gian

Che phủ trước

Che lấp liên tục

Che phủ sau

Trang 35

- Mã hoá dự báo miền thời gian: Loại mã hoá này sử dụng mã hoá vi sai

để khôi phục phần chênh lệch giữa các mẫu kề nhau Tốc độ bit được giảm sẽ

có thể dùng để mã hoá và truyền thông tin audio

- Mã hoá biến đổi miền tần số: Kỹ thuật này dùng các khối của các mẫu audio mã hoá PCM tuyến tính, được biến đổi từ miền thời gian thành một số nhất định các băng tần khác nhau trong miền tần số

Hiện tượng che lấp quan trọng nhất xảy ra trong miền tần số Để lợi dụng

đặc điểm này, phổ tín hiệu audio được phân tích thành nhiều băng phụ có độ phân giải thời gian và tần số phù hợp với bề rộng các băng tần tới hạn của HAS Mỗi băng phụ chứa một số thành phần âm rời rạc

1.3.2.1 Giảm dữ liệu không tổn thất

Nén không tổn thất cho phép khôi phục thông tin dữ liệu gốc từ bit đến bit sau khi dãn một cách trung thực Nó loại bỏ độ dư thừa thống kê tồn tại trong tín hiệu audio bằng các giá trị dự báo từ các mẫu trước Có thể đạt tỉ lệ nén thấp (tốt nhất là 2:1) và phụ thuộc vào độ phức tạp của tín hiệu audio gốc Nhờ mã hoá dự báo miền thời gian mà ta có thể nén không tổn thất:

• Thuật toán vi sai: Tín hiệu audio có chứa các âm lặp lại cũng như số lượng lớn độ dư thừa và các âm thanh không thích hợp Dữ liệu lặp lại được loại bỏ trong quá trình mã hoá và được khôi phục lại tại phần giải mã Kỹ thuật DPCM cũng có thể sử dụng cho tín hiệu audio Đầu tiên tín hiệu audio

được tách ra thành một số các băng tần con có chứa một số âm rời rạc Sau đó mã hoá bằng DPCM và bộ dự báo thích hợp cho các băng có chu kỳ ngắn Loại mã hoá thích nghi này được thực hiện trên cơ sở quan sát năng lượng tín hiệu đầu vào để cải biên kích thước bước lượng tử hoá Đó là DPCM thích nghi (ADPCM)

3bit số mũ

16 bit

16 bit

Dòng bit mã hoá

16-bit ADC

Tính toán thang độ

Trang 36

Hình 1.22: Hệ thống mã hoá điểm quá tải khối dữ liệu audio

• Bộ mã hoá entropy tách độ dư thừa bằng cách biểu diễn các hệ số lượng

tử hoá của băng tần con nhằm nâng cao hiệu quả mã hoá Các hệ số này được truyền theo bậc tăng tần số, tạo các giá trị lớn tại các tần số thấp và bước chạy dài của các giá trị nhỏ hoặc gần bằng 0 cho các tần số cao VLC được thực hiện nhờ các bảng giá trị Huffman khác nhau để phù hợp thống kê tốt nhất với các giá trị có tần số thấp và cao

• Các thông số quá tải khối dữ liệu: Các giá trị nhị phân từ quá trình biến

đổi ADC, được nhóm thành các khối dữ liệu cả trong miền thời gian (bằng cách lấy mẫu kề nhau tại đầu ra ADC) lẫn trong miền tần số (bằng cách lấy các hệ số tần số tại đầu ra FDCT) Các giá trị nhị phân trong 1 block dữ liệu sau đó được tạo thang độ tiếp, sao cho giá trị vừa dưới giá trị thang độ đầy đủ

Hệ số thang độ này ( gọi là số mũ) là chung cho tất cả các giá trị trong khối Cho nên, mỗi giá trị có thể biểu diễn bằng một định trị (giá trị mẫu) và bằng một số mũ (chỉ thị biên độ riêng của mẫu) Đó là quá trình lượng tử hoá không

đều và kích thước bước lượng tử hoá được xác định bằng số các bít chiếm trong khối Vị trí bít được tính trong mô hình HAS (hình 1.21) Giảm tốc độ

dữ liệu được thực hiện bằng cách gửi giá trị mũ lần một/ khối dữ liệu Mặc dù nhiễu phụ thuộc nội dung tín hiệu, nhưng mã hoá được thực hiện tốt Kỹ thuật che mặt nạ giúp giảm nhiễu audio

1.3.2.2 Giảm dữ liệu có tổn thất

Nén có tổn thất nhờ kết hợp 2 hoặc nhiều kỹ thuật xử lý để sử dụng đặc

điểm không nhạy của HAS nhằm tách các thành phần phổ theo các thành phần

có biên độ cao hơn Giảm dữ liệu có tổn thất cho tỉ lệ nén từ 2:1 đến 20:1, phụ

Trang 37

thuộc vào độ phức tạp của quá trình mã hoá- giải mã và yêu cầu về chất lượng audio

Giảm dữ liệu có tổn thất sử dụng kỹ thuật mã hoá thụ cảm, nguyên lý cơ bản là loại bỏ độ dư thừa thụ cảm trong tín hiệu audio bằng cách xoá bất kỳ tín hiệu nào nằm dưới đồ thị ngưỡng Nén audio có tổn hao nhờ kết hợp nhiều

kỹ thuật:

• Che phủ miền thời gian và tần số các thành phần số liệu

• Che phủ lượng tử cho mỗi âm audio bằng cách sắp xếp đủ các bit để làm cho mức nhiễu lượng tử luôn dưới đồ thị che mặt nạ Tại các tần số gần tín hiệu audio, tỉ số SNR = 20dB - 30dB (độ phân giải 4 - 5 bit)

• Mã hoá nối Kỹ thuật này tách độ dư thừa trong hệ thống đa kênh audio (các dữ liệu giống nhau tồn tại trong tất cả các kênh) Do đó, giảm dữ liệu được thực hiện nhờ mã hoá các dữ liệu giống nhau và chỉ thị cho bộ giải mã lặp lại

1.3.2.3 Quá trình mã hoá audio

Hiệu ứng che mặt nạ quan trọng nhất, xảy ra trong miền tần số Để tách

đặc tính này, phổ tín hiệu audio được tách thành các băng tần con với độ phân giải thời gian và tần số phù hợp với các độ rộng băng tần tới hạn của HAS Cấu trúc cơ bản của bộ mã hoá cảm thụ :

Băng lọc

Mô hình thu nhận

Lượng tử hoá mã hoá

Phân bố bit

Ghép kênh

Phân bổ bit

tín hiệu vào

Trang 38

Hình 1.23: Bộ mã hoá thụ cảm audio cơ bản

• Bộ xử lý thang độ và lượng tử hoá

• Bộ ghép kênh dữ liệu: Nhận dữ liệu lượng tử hoá và cộng thông tin phụ (thông tin vị trí bit và hệ thống thang độ) cho quá trình giải mã

a/ Filter bank

Có 3 loại filter bank:

- Subband bank: Phổ tín hiệu được chia thành các băng tần con có độ rộng bằng nhau (32 băng con trong MPEG - Layer I và II) Nó tương tự quá trình HAS phân tích tần số (chia phổ audio thành các băng tới hạn) Độ rộng các băng tần con tới hạn có thay đổi Dưới 500Hz, độ rộng băng là 100Hz, và

nó tăng đến nhiều KHz (trên 10 KHz) Dưới 500Hz, một băng tần con chứa nhiều băng tần tới hạn Các mạch lọc băng tần con (như mạch lọc gương bình phương đa pha: PQMF) có phần chồng nhau nhỏ và được dùng cho các mẫu thời gian kề nhau Ví dụ trong MPEG – Layer II, một frame audio được tách thành 32 băng con bằng nhau, mỗi băng con chứa 36 mẫu

Mỗi tín hiệu băng con sau đó được lượng tử hoá đều với một vị trí bit cho băng con để duy trì tỷ số mặt nạ trên nhiễu MNR (Mask to Noise Ratio) dương Tỷ số này là dương nếu đồ thị mặt nạ trên mức nhiễu

- Tranform bank: Thuật toán DCT cải biên (MDCT) được dùng để biến tín hiệu audio trong miền thời gian thành một số lượng lớn các băng tần con (256 - 1024) Sẽ có một số phần chồng giống nhau trong filter bank này

- Filter bank lai: Chúng hình thành các mạch lọc băng tần con tiếp theo sau mạch lọc MDCT Sự kết hợp này sẽ cung cấp độ phân giải tần số tinh hơn như dùng trong MPEG III Tín hiệu vào đầu tiên được tách thành 32 băng tần con băng PQMF, sau đó MDCT được dùng trong 18 mẫu trong mỗi băng tần con (cung cấp 576 băng tần rất hẹp) Kết quả cho độ phân giải thời gian là 3.8ms

Trong các tín hiệu audio tĩnh, MDCT được thực hiện trên 18 mẫu đầu ra của băng tần con (cung cấp 2 biến đổi/ băng con/ Frame) Nếu được tách tức

Trang 39

thời trong tín hiệu, thì thực hiện MDCT trên 6 mẫu đầu ra của băng tần con; kết quả độ phân giải theo thời gian được nâng cao 1.27ms

Đặc trưng độ phân giải mạch lọc là kết quả phối hợp có hiệu quả của nhiều hệ số quan trọng Filter bank có độ phân giải thấp cho một số nhỏ các băng tần con và các thành phần âm thanh của hầu hết các phổ tín hiệu audio rơi trong từng băng con Vì lý do này cần mã hoá từng băng tần con Tuy nhiên một số ít băng tần con trong mạch lọc này làm giảm độ phức tạp mã hóa

và giải mã, trong khi đó cho độ phân giải về thời gian tốt

Bộ filter bank có độ phân giải cao, tạo một số lớn các băng tần con và các thành phần âm thanh của phổ tín hiệu audio không rơi vào trong tất cả các băng tần con Các băng tần con không có các thành phần âm thanh sẽ không cần mã hoá, do đó kết quả sẽ giảm tốc độ dữ liệu mã hoá Độ rộng băng tần hẹp có thể mô phỏng tốt hơn độ rộng băng tần giới hạn của HAS Tuy nhiên chúng có độ phân giải thời gian thấp (tạo các hiệu ứng tiền echo trong thời gian mã hóa tín hiệu tức thời) Có thể sử dụng Filter bank thích nghi bằng bộ tách tức thời

Một filter bank biến đổi 256 băng, có độ phức tạp tương tự filter bank

32 băng con

Đặc điểm của quá trình filter bank được trình bày theo:

- Độ phân giải theo thời gian: bằng độ dài khối filter bank của các mẫu nhân với 20.83às, độ rộng của một mẫu là 20.83às đối với tốc độ lấy mẫu 48KHz Thông số này cho ý tưởng của bộ hoạt động mã hoá tín hiệu tức thời

Ví dụ mã hoá AC - 3: 128 x 20.83=2.66ms

- Độ phân giải theo tần số: Bằng độ rộng băng tần phổ cực đại/ tổng số băng tần con Độ rộng băng tần phổ cực đại bằng 24 KHz đối với tốc độ lấy mẫu 48KHz Ví dụ mã hoá AC – 3: 24000/256=93.75 Hz

- Độ dài Frame: Bằng số băng tần con nhân số mẫu trong một khối nhân với 20.83às Giá trị này được tính cho tốc độ lấy mẫu 48 KHz Ví dụ mã hoá MPEG layer I: 32x12x20.83=8ms

Trang 40

b/ Mô hình cảm thụ, đồ thị mặt nạ và vị trí bit

Có thể phân tích tâm sinh lý nghe với tín hiệu vào PCM (về nội dung năng lượng và tần số) nhờ thuật toán biến đổi fourier nhanh FFT Đồ thị mặt nạ được tính từ ngưỡng nghe thấy và các đặc tính che tần số của HAS Dạng

và mức của đồ thị mặt nạ phụ thuộc nội dung tín hiệu Trong hình 1.24, độ

chênh lệch giữa đường bao phổ tín hiệu và đồ thị mặt nạ được giảm đến mức cực đại là 40dB Độ chênh lệch quyết định số bit cực đại (trên cơ sở 6dB/bit) cần để mã hoá tất cả các phổ tín hiệu audio Quá trình xác lập vị trí bit đảm bảo nhiễu lưỡng tử hoá thấp hơn mức nghe thấy Mức đồ thị mặt nạ cao hơn

đường bao phổ tín hiệu 12KHz và không cần sắp xếp bit trong vùng này

Từ đồ thị mặt nạ, các ngưỡng mặt nạ được dẫn từ mỗi băng tần con Mỗi ngưỡng quyết định năng lượng nhiễu lưỡng tử hoá cực đại chấp nhận trong mỗi băng tần con (tại đó nhiễu bắt đầu phát ra âm thanh cho các hệ thống nén không tổn thất)

Mã hoá MPEG dùng quá trình sắp xếp vị trí bit tiến - thích nghi, vì việc tính toán vị trí bit chỉ được tiến hành trên tín hiệu của bộ mã hoá Ngoài ra thông tin phụ cần một độ rộng băng tần truyền nhất định

(Hz) Phõn bố bit

8K 2K

Biờn độ

Tần số 6K

Đường bao tớn hiệu phổ (tớnh toỏn)

Ngày đăng: 25/02/2021, 11:34

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w