1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu kỹ thuật mã hóa nén tín hiệu âm thanh ứng dụng tại đài tiếng nói việt nam

125 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 125
Dung lượng 6,67 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

NGHIÊN CỨU KỸ THUẬT MÃ HÓA NÉN TÍN HIỆU ÂM THANH ỨNG DỤNG TẠI ĐÀI TIẾNG NÓI VIỆT NAM Học viên: Nguyễn Thanh Phong Chuyên ngành: Kỹ thuật Điện Tử Mã số: CH683 Khóa: 36 Trường Đại học Bá

Trang 1

TRẦN HỮU LỘC

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN THANH PHONG

LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ

Trang 2

NGUYỄN THANH PHONG

LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ

Chuyển nghành: KỸ THUẬT ĐIỆN TỬ

Mã số: 8520203

Người hướng dẫn khoa hoc:

TS HOÀNG LÊ UYÊN THỤC

NGHIÊN CỨU KỸ THUẬT MÃ HÓA NÉN TÍN HIỆU

ÂM THANH ỨNG DỤNG TẠI ĐÀI

TIẾNG NÓI VIỆT NAM

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA

DUT.LRCC

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan đề tài: ―NGHIÊN CỨU KỸ THUẬT MÃ HÓA NÉN TÍN HIỆU ÂM THANH ỨNG DỤNG TẠI ĐÀI TIẾNG NÓI VIỆT NAM‖ là một công trình nghiên cứu độc lập, không có sự sao chép của người khác Đề tài là kết quả mà tôi đã nỗ lực nghiên cứu trong quá trình học tập ở bậc cao học tại Trường Đại Học Bách Khoa – Đại học Đà Nẵng, dưới sự hướng dẫn của TS Hoàng Lê Uyên Thục, giảng viên Khoa Điện tử - Viễn thông thuộc Nhà Trường

Trong quá trình viết thuyết minh và làm thực nghiệm, tôi có sử dụng số liệu, dữ liệu riêng của Đài Tiếng nói Việt Nam, nơi tôi đang công tác và tham khảo một số tài liệu có nguồn gốc xuất xứ rõ ràng

Tôi xin cam đoan nếu có vấn đề gì sai trái tôi xin chịu hoàn toàn trách nhiệm

Người cam đoan

Nguyễn Thanh Phong DUT.LRCC

Trang 4

MỤC LỤC

LỜI CAM ĐOAN ii

MỤC LỤC ii

DANH MỤC HÌNH viii

DANH MỤC BẢNG ix

MỞ ĐẦU 1

1 Đặt vấn đề 1

2 Mục tiêu, đối tượng và phạm vi nghiên cứu 1

3 Đối tượng và phạm vi nghiên cứu 2

4 Phương pháp nghiên cứu 2

5 Cấu trúc của luận văn 3

6 Ý nghĩa của luận văn 3

Chương 1: GIỚI THIỆU TỔNG QUAN VỀ HỆ THỐNG PHÁT THANH CỦA ĐÀI TIẾNG NÓI VIỆT NAM 5

1.1 Giới thiệu chương 5

1.2 Giới thiệu tổng quan về Đài Tiếng Nói Việt Nam 5

1.2.1 Các kênh phát thanh 5

1.2.2 Truyền hình 7

1.2.3 Báo chí 8

1.2.4 Phát thanh, truyền hình trên internet và điện thoại di động 8

1.3 Các loại sóng phát thanh đang dùng của Đài TNVN 8

1.3.1 Sóng trung 8

1.3.2 Sóng ngắn 9

1.3.3 Sóng FM 9

1.4 Phát thanh tín hiệu tương tự tại Đài TNVN 10

1.4.1 Sơ đồ nguyên lý cơ bản phát thanh tín hiệu tương tự tại Đài TNVN 10

1.4.2 Ưu nhược điểm của phát thanh tín hiệu tương tự 11

1.5 Một số tiêu chuẩn phát thanh số đang được thử nghiệm tại Đài TNVN 12

1.5.1 Phát thanh số tiêu chuẩn EUREKA 147 (DAB) 12

1.5.2 Phát thanh số tiêu chuẩn DRM 14

1.5.3 Phát thanh số tiêu chuẩn DMB 14

1.6 Kết luận chương 1 15

Chương 2: LÝ THUYẾT MÃ HÓA NÉN ÂM THANH 16

2.1 Giới thiệu chương 16

2.2 Lý thuyết cơ bản về âm thanh 16

2.2.1 Âm thanh 16

2.2.2 Sự cảm thụ âm thanh của tai người 17

2.2.3 Tín hiệu âm thanh tương tự 18

2.3 Số hóa tín hiệu âm thanh 20

2.3.1 Lấy mẫu 20

2.3.2 Lượng tử hóa 23

2.3.3 Mã hóa 23

2.4 Lý thuyết cơ bản về nén âm thanh số 24

2.4.1 Mã hóa nén không tổn hao 24

DUT.LRCC

Trang 5

2.5.1 Định dạng âm thanh số gốc 26

2.5.2 Định dạng âm thanh nén không tổn hao 27

2.5.3 Định dạng âm thanh nén có tổn hao 27

2.6 Kết luận chương 2 28

Chương 3: CÁC KỸ THUẬT MÃ HÓA NÉN ÂM THANH 29

3.1 Giới thiệu chương 29

3.2 Mô hình tâm lý thính giác ở người 29

3.2.1 Độ nhạy của tai 30

3.2.2 Hiệu ứng che 32

3.3 Nguyên lý mã hóa cảm quan 34

3.3.1 Xử lý tín hiệu trong bộ mã hóa cảm quan 35

3.3.2 Mã hóa cảm quan MPEG-1 36

3.3.3 Mã hóa cảm quan MPEG-2 38

3.4 Kỹ thuật mã hóa nén âm thanh số theo chuẩn MP3 39

3.4.1 Giàn lọc băng con 39

3.4.2 Lập mô hình cảm quan 41

3.4.3 Lượng tử hóa 41

3.4.4 Mã hóa 42

3.4.5 Định dạng dòng bit 42

3.5 Kỹ thuật mã hóa âm thanh theo chuẩn AAC 43

3.5.1 Các khâu xử lý tín hiệu cải tiến từ MP3 43

3.5.2 Các khâu xử lý tín hiệu mới bổ sung cho AAC 45

3.6 So sánh kỹ thuật mã hóa nén MP3 và AAC 45

3.6.1 Tính phổ biến 45

3.6.2 Tỷ lệ nén 46

3.6.3 Chất lượng âm thanh 46

3.6.4 Khả năng tương thích 46

3.7 Kết luận chương 3 47

Chương 4: THỰC NGHIỆM ỨNG DỤNG MÃ HÓA NÉN ÂM THANH SỐ TẠI ĐÀI TIẾNG NÓI VIỆT NAM 48

4.1 Giới thiệu chương 48

4.2 Chuẩn bị thí nghiệm 48

4.2.1 Chuẩn bị cơ sở dữ liệu 48

4.2.2 Chuẩn bị cơ sở vật chất 50

4.3 Quy trình thí nghiệm 52

4.3.1 Thí nghiệm đánh giá hiệu năng nén 52

4.3.2 Thí nghiệm đánh giá chất lượng nén 53

4.4 Kết quả đánh giá hiệu năng nén 54

4.5 Kết quả đánh giá chất lượng nén 56

4.5.1 Kết quả đánh giá chất lượng nén theo phương pháp khách quan 56

4.5.2 Kết quả đánh giá chất lượng nén theo phương pháp chủ quan 59

4.6 Ứng dụng kỹ thuật mã hóa nén trong phát thanh 60

4.6.1 Ứng dụng vào phát thanh trên internet và di động 61

4.6.2 Ứng dụng lưu trữ chương trình phát thanh sau khi sản xuất 61

4.6.3 Ứng dụng lưu trữ chương trình phát thanh sau khi phát sóng 62

4.6.4 Ứng dụng lưu trữ kho nhạc hiện tại 63

DUT.LRCC

Trang 6

4.6.5 Ứng dụng lưu trữ để trao đổi nội dung phát sóng giữa các hệ 63

4.7 Kết luận chương 4 64

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 65

Kết luận 65

Hướng phát triển của đề tài 65

TÀI LIỆU THAM KHẢO 66

TIẾNG VIỆT 66

PHỤ LỤC

DUT.LRCC

Trang 7

NGHIÊN CỨU KỸ THUẬT MÃ HÓA NÉN TÍN HIỆU ÂM THANH ỨNG

DỤNG TẠI ĐÀI TIẾNG NÓI VIỆT NAM

Học viên: Nguyễn Thanh Phong Chuyên ngành: Kỹ thuật Điện Tử

Mã số: CH683 Khóa: 36 Trường Đại học Bách khoa - ĐHĐN

Tóm tắt — Tại Đài Tiếng nói Việt Nam (TNVN), các kênh âm thanh số hiện nay

đang được mã hóa theo chuẩn không nén Do bản chất mà những tệp âm thanh dạng không nén có dung lượng cực lớn, vì vậy yêu cầu dung lượng ổ cứng lưu trữ các chương trình phát thanh rất lớn và việc thao tác trên các đoạn âm thanh rất khó khăn Luận văn thực hiện áp dụng thử nghiệm các chuẩn nén âm thanh tại Đài TNVN, bao gồm chuẩn MP3 (Moving Picture Experts Group 1- Layer 3) và AAC (Moving Picture Experts Group 2- Advanced Audio Coding) Lần lượt các chuẩn MP3 và AAC được áp dụng cho 18 tệp âm thanh trích chọn từ các chương trình khác nhau gần đây của Đài với tổng dung lượng là 5546MB (tương đương thời lượng hơn 8 giờ), sau đó được đánh giá dựa trên các tiêu chí về hiệu năng bao gồm thời gian thực thi và tỷ lệ nén Tiêu chí chất lượng được đánh giá theo phương pháp khách quan dựa vào tỷ lệ lỗi MSE (Mean Squared Error) và đánh giá chủ quan dựa vào nghe thử Thí nghiệm nghe thử được tiến hành trên 24 đoạn âm thanh ngắn nhiều thể loại, mỗi đoạn kéo dài trung bình là 20 giây, với số lượng tình nguyện viên tham gia là 35 người

Kết quả nghiên cứu cho thấy tính khả thi của việc áp dụng các chuẩn nén âm thanh mới tại đài TNVN, đặc biệt giúp xác định tập giá trị các tham số phù hợp nhất đối với từng chuẩn nén nhằm tiết kiệm dung lượng lưu trữ dữ liệu và giảm thời gian thao tác trên tín hiệu, trong khi vẫn đảm bảo chất lượng dịch vụ phát thanh

Từ khóa — Mã hóa nén âm thanh, mã hóa MP3 (Moving Picture Experts Group

1 – Layer 3), mã hóa AAC (Moving Picture Experts Group 2 – Advanced Audio Coding), đánh giá chủ quan, nghe thử

DUT.LRCC

Trang 8

A STUDY OF THE APPLICATION OF DIGITAL AUDIO COMPRESSION TECHNIQUES TO THE VOICE OF VIETNAM NATIONAL STATION

Student: Nguyen Thanh Phong Major: Electronics Technology

Code: CH683 Course: 36 The University Of DaNang

University Of Science And Technology

Abstract—At the Voice Of Vietnam national station (VOV), the digital audio

channels are currently encoded by uncompressed audio codings in wave format Basically, the size of wave format-based audio files is extremely large, so the capacity

to store the radio programs is very high and the manipulation on audio clips is very complex

This thesis aims to validate the experimental applications of audio compression standards including MP3 (Moving Picture Experts Group 1- Layer 3) and AAC (Moving Picture Experts Group 2- Advanced Audio Coding) to The VOV MP3 and AAC are sequentially applied to 18 audio clips extracted from different instant VOV programs during over 8 hours, and then are measured based on performance metrics including processing time and compresstion ratio The audio quality is evaluated objectively based on MSE (Mean Squared Error) and subjectively based on listening tests Listening tests are implemented on 24 multi-genre audio clips with a participation of 35 volunteers

The experimental results show the feasibility of the application of MP3 and AAC techniques to The VOV Based on the experimental results, the most appropriate parameter values of new audio techiniques are also determined in order to save the storage capacity and the signal manipulation time while ensuring the required quality

of audio service

Key words— Audio compression coding, code MP3 (Moving Picture Experts

Group 1 – Layer 3), code AAC (Moving Picture Experts Group 2 – Advanced Audio Coding), Subjective evaluation, testing listen

DUT.LRCC

Trang 9

Advanced Audio Coding Amplitude Modulation Audio Interchange File Format

: :

: :

: : :

: : : : : : : : :

Code Orthogonal Frequency

Digital Audio Broadcasting Digital Multimedia Broadcasting Differential Pulse Code Modulation Digital Radio Mondiale Digital Sound Broadcasting

European Broadcasting Union European Telecommunications Standards Institute

Frequency Modulation Free Lossless Audio code

High Definition Radio High Efficiency-ACC Harmonic Vector Excitation Coding

International Electrotechnical Commission International Telecommunication Union International Organization Of Standardition Intergrated Srevices Digital Broadcast Terrestriall Linear Prediction Analysis

Moving Picture Experts Group National Radio Systems Committee Orthogonal Frequency Division Multiplexing Pulse Code Modulation

W

DUT.LRCC

Trang 10

DANH MỤC HÌNH

Hình 1.1 Bản đồ phủ sóng phát thanh của Đài TNVN (nguồn Trung Tâm Kỹ Thuật

Phát Thanh VOV) 6

Hình 1.2 Sơ đồ nguyên lý phát thanh tín hiệu tương tự tại Đài TNVN 11

Hình 1.3 Sơ đồ máy phát thanh số chuẩn EUREKA 147 13

Hình 1.4 Sơ đồ khối máy phát thanh số theo tiêu chuẩn DRM 14

Hình 2.1 Quá trình chuyển đối tín hiệu tương tự sang tín hiệu số 20

Hình 2.2 Lấy mẫu lý tưởng 21

Hình 2.3 Phổ của tín hiệu lấy mẫu 22

Hình 2.4 Quá trình lấy mẫu thực tế 23

Hình 2.5 Hàm lượng tử hóa với bước lượng tử q = 1 23

Hình 3.1 Ngưỡng nghe tuyệt đối 30

Hình 3.2 Ngưỡng nghe tuyệt đối được xác định dựa trên mức thanh áp SPL 31

Hình 3.3 Nhiễu lượng tử hóa trong trường hợp lượng tử hóa 12 bit 31

Hình 3.4 Phân chia băng con và lượng tử hóa với số bit thay đổi 32

Hình 3.5 Âm mạnh hơn làm méo ngưỡng nghe tuyệt đối của âm yếu hơn 33

Hình 3.6 Áp dụng hiệu ứng che tần số vào nén âm thanh 34

Hình 3.7 Hiệu ứng che thời gian trước và sau 34

Hình 3.8 Kết hợp hiệu ứng che thời gian và che tần số 34

Hình 3.9 Bộ mã hóa và giải mã âm thanh theo khung 36

Hình 3.10 Bộ mã hóa âm thanh MPEG chia mỗi khung tín hiệu âm thanh thành 32 băng con rộng bằng nhau 38

Hình 3.11 Sơ đồ khối bộ mã hóa audio theo chuẩn MP3 39

Hình 3.12 Sự chồng lấp các khối dữ liệu với nửa sau của khối này chồng lên nửa đầu của khối tiếp theo 41

Hình 3.13 Sơ đồ khối bộ mã hóa audio theo chuẩn MPEG-2 AAC 43

Hình 3.14 Đoạn ghi âm của đàn cascanet 44

Hình 3.15 Tác dụng của TNS 45

Hình 4.1 Hình ảnh phòng thí nghiệm 51

Hình 4.2 Bass base và card âm thanh để kiểm chứng bằng headphone 52

Hình 4.3 Quy trình thí nghiệm đánh giá các chuẩn nén 53

Hình 4.4 Lưu trữ chương trình trước khi phát sóng 61

Hình 4.5 Lưu trữ lại chương trình sau khi phát sóng 62

Hình 4.6 Lưu trữ kho nhạc 63

Hình 4.7 Lưu trữ âm thanh sử dụng chung giữa các hệ 64

DUT.LRCC

Trang 11

DANH MỤC BẢNG

Bảng 2.1 Mã hóa A-law 24

Bảng 2.2 Mã hóa µ -law 24

Bảng 4.1 Tập cơ sở dữ liệu thứ nhất 49

Bảng 4.2 Tập cơ sở dữ liệu thứ hai 50

Bảng 4.3 Kết quả đánh giá hiệu năng các chuẩn nén ở tần số 44.1kHz 56

Bảng 4.4 Kết quả đánh giá hiệu năng các chuẩn nén ở tần số 22.05kHz 56

Bảng 4.5 Giá trị MSE của chuẩn nén MP3 57

Bảng 4.6 Giá trị MSE của chuẩn nén AAC 58

Bảng 4.7 Điểm đánh giá chất lƣợng âm thanh nén theo chuẩn MP3 59

Bảng 4.8 Điểm đánh giá chất lƣợng âm thanh nén theo chuẩn AAC 59

DUT.LRCC

Trang 12

MỞ ĐẦU

1 Đặt vấn đề

Qua gần 74 năm hoạt động (từ 07/09/1945 đến nay), Đài Phát thanh Tiếng nói Việt Nam (TNVN) có gần 41.000 giờ tư liệu quý cần được lưu giữ lâu dài Do vậy lưu trữ âm thanh là vấn đề rất lớn, đang được Đài TNVN hết sức quan tâm Đài sẽ có dự

án riêng về chiến lược lưu trữ cho ngành phát thanh Việt Nam, trong đó sẽ xác định chính sách lưu trữ, phương tiện lưu trữ, lộ trình, qui trình chuyển đổi các dữ liệu

Quan trọng hơn, Đài TNVN đang dần tiếp cận lộ trình chuyển đổi công nghệ phát thanh cho đến năm 2020 về việc ứng dụng toàn phần công nghệ số DRM, DRM+ (Phát thanh số trên băng tần nhỏ hơn 30MHz) vào cho phát thanh DRM sử dụng công nghệ COFDM, tín hiệu âm thanh nén MPEG, AAC kết hợp với một số kỹ thuật nén khác như SBR, MPEG 4 CELP, HVXC

Thêm vào đó, hiện nay công tác dàn dựng đến khâu truyền dẫn phát sóng đều đang sử dụng chuẩn wave (Waveform Audio), dẫn đến tiêu tốn dung lượng ổ cứng rất nhiều Các khuyết điểm cụ thể của chuẩn wave có thể kể ra như sau:

- Thứ nhất, tệp âm thanh chuẩn wave thời lượng một phút có dung lượng là hơn 10MB (Megabyte), như vậy trong một ngày thì sẽ tốn lưu trữ là gần 15GB (Gigabyte) Hầu hết các chương trình phát thanh đã sử dụng cần phải được lưu lại trong một thời gian rất dài, vì thế rất tốn thiết bị và cơ sở vật chất cho việc lưu trữ

- Thứ hai, việc trao đổi các tệp âm thanh giữa các hệ phát thanh trên cùng một sever cố định của Đài TNVN thì việc tải các tệp wave về sử dụng là rất tốn thời gian

Tình hình thực tiễn đã phân tích ở trên dẫn đến nhu cầu cấp thiết phải áp dụng công nghệ mới cho tương lai tại Đài TNVN, trong đó tập trung vào các kỹ thuật mã hóa nén tín hiệu âm thanh mới nhằm đáp ứng tốt nhất yêu cầu về dung lượng và chất lượng

Xuất phát từ bối cảnh trên, đề tài ―Nghiên cứu kỹ thuật mã hóa nén tín hiệu âm

thanh ứng dụng tại Đài Tiếng Nói Việt Nam” được chọn làm nội dung nghiên cứu cho

luận văn

2 Mục tiêu, đối tượng và phạm vi nghiên cứu

Quy trình phát thanh là từ phòng sản xuất đến phòng kiểm thính và cuối cùng là các máy lưu trữ phát sóng, chưa tính các máy thu lại tín hiệu đã phát sóng Do đó, một sản phẩm âm thanh chuẩn wave sẽ tốn nhiều tài nguyên máy tính và thời gian xử lý

DUT.LRCC

Trang 13

nén phù hợp để có thể ứng dụng trên sóng phát thanh của Đài Tiếng nói Việt Nam, sao cho thỏa mãn các yêu cầu về tài nguyên máy tính, thời gian xử lý và chất lượng phát thanh

Cụ thể là luận văn cần đạt được các mục tiêu sau đây:

- Thứ nhất, hệ thống hóa lý thuyết mã hóa nén âm thanh số trên nền kiến thức về phát thanh hiện đại

- Thứ hai, nghiên cứu áp dụng thử nghiệm các kỹ thuật mã hóa nén cụ thể MP3 (Moving Picture Experts Group 1- Layer 3) và AAC (Moving Picture Experts Group 2- Advanced Audio Coding) để phục vụ cho công việc dàn dựng và lưu trữ âm thanh

- Thứ ba, tìm chọn được kỹ thuật mã hóa nén phù hợp có thể phát thử nghiệm trên sóng phát thanh của Đài TNVN

3 Đối tượng và phạm vi nghiên cứu

Dựa vào các mục tiêu nghiên cứu nói trên, luận văn tập trung vào hai đối tượng nghiên cứu chính là:

- Thứ nhất, các chuẩn mã hóa nén âm thanh MP3 và AAC

- Thứ hai, các đánh giá về các chuẩn nén MP3 và AAC khi áp dụng thử nghiệm tại Đài TNVN

Các vấn đề nghiên cứu nên trên được giải quyết trong các phạm vi cụ thể sau:

- Thứ nhất, các chuẩn nén MP3 và AAC được áp dụng cho các loại tệp âm thanh bao gồm tiếng nói, âm nhạc và hỗn hợp

- Thứ hai, các tệp âm thanh được lựa chọn thử nghiệm trích từ các chương trình đang được lưu trữ tại Đài TNVN

- Thứ ba, các tiêu chuẩn đánh giá về hiệu năng bao gồm thời gian thực thi

và tỷ lệ nén; tiêu chuẩn đánh giá về chất lượng bao gồm tỷ lệ lỗi và điểm chất lượng dựa vào nghe thử

4 Phương pháp nghiên cứu

Luận văn được thực hiện trên cơ sở kế thừa các kiến thức nền tảng về:

Trang 14

- Phương pháp nghiên cứu sử dụng trong luận văn là kết hợp lý thuyết và thực nghiệm, bao gồm các công việc chính sau đây:

- Nghiên cứu lý thuyết: tìm hiểu các kiến thức cơ bản về mã hóa nén tín hiệu âm thanh theo các tiêu chuẩn khác nhau; xem xét, phân tích, so sánh, đánh giá các

ưu khuyết điểm của các kỹ thuật nén khác nhau về mặt lý thuyết

- Nghiên cứu thực nghiệm: thử nghiệm ứng dụng các kỹ thuật nén khác nhau; đánh giá các kỹ thuật nén về hiệu năng và chất lượng, sử dụng phương pháp khách quan dựa trên các tiêu chuẩn kỹ thuật và phương pháp chủ quan dựa vào nghe thử

5 Cấu trúc của luận văn

Trên cơ sở về tính cấp thiết của vấn đề nghiên cứu và các nhiệm vụ nghiên cứu

đặt ra, ngoài phần Mở đầu và phần Kết luận và hướng phát triển, luận văn được cấu

trúc gồm 04 chương với nội dung chính của các chương như sau:

Chương 1 giới thiệu tổng quan về Đài TNVN, các hệ thống phát thanh đang sử

dụng và các tiêu chuẩn phát thanh số hiện đại Từ đó nêu lên ý nghĩa của việc chuyển đổi sang công nghệ phát thanh mới cũng như sự cần thiết sử dụng các kỹ thuật nén âm thanh mới

Chương 2 tập trung hệ thống hóa lý thuyết cơ bản về âm thanh và mã hóa nén tín

hiệu âm thanh, nhằm làm nền tảng cho nghiên cứu về các kỹ thuật mã hóa nén âm thanh cụ thể trong chương tiếp theo

Chương 3 trình bày và phân tích về các kỹ thuật mã hóa nén âm thanh cảm quan

theo chuẩn MP3 và AAC Đây là những chuẩn nén chất lượng cao phổ biến sẽ được thử nghiệm áp dụng tại Đài TNVN

Chương 4 trình bày các thí nghiệm đánh giá các chuẩn nén MP3 và AAC trong

việc áp dụng trên các tệp âm thanh trích chọn từ các chương trình khác nhau tại Đài TNVN Từ đó đề xuất lựa chọn chuẩn nén phù hợp cũng như tập tham số đi kèm, nhằm đạt yêu cầu cân đối tốt nhất giữa hiệu năng nén và chất lượng nén

6 Ý nghĩa của luận văn

Luận văn đã thực hiện đánh giá hai chuẩn nén âm thanh số MP3 và AAC về hiệu năng và chất lượng, áp dụng thử nghiệm trên một số chương trình phát thanh của Đài TNVN thường trú Cần Thơ Luận văn đã đạt được những kết quả thực tế ban đầu để có thể tiếp tục phát triển các nghiên cứu thử nghiệm trong tương lai, nhằm xác định chuẩn nén và tập tham số phù hợp cho việc số hóa phát thanh

Hiện nay Đài TNVN đang thử nghiệm các chuẩn phát thanh mới nhưng các cơ sở

DUT.LRCC

Trang 15

có báo cáo chính thức Do vậy, kết quả của đề tài có thể sẽ là một tiền đề quan trọng tạo cơ sở thiết thực cho việc triển khai số hóa tại Đài trong tương lai

Sản phẩm khoa học của Luận văn là Bài báo đăng trong Kỷ yếu của Hội nghị

Khoa học Quốc gia lần thứ XII ―Nghiên cứu cơ bản và Ứng dụng Công nghệ Thông

tin” (Huế 8-9/6/2019)

DUT.LRCC

Trang 16

Chương 1: GIỚI THIỆU TỔNG QUAN VỀ HỆ THỐNG PHÁT THANH CỦA

ĐÀI TIẾNG NÓI VIỆT NAM 1.1 Giới thiệu chương

Chương này sẽ giới thiệu tổng quan về Đài Tiếng Nói Việt Nam, trong đó tập trung vào các hệ thống phát thanh đang sử dụng và các tiêu chuẩn phát thanh số hiện đại đang được thử nghiệm Từ đó nêu lên ý nghĩa của việc chuyển đổi sang công nghệ phát thanh mới cũng như sự cần thiết sử dụng các kỹ thuật nén âm thanh mới

Chương này bao gồm các nội chính sau:

- Giới thiệu tổng quan về Đài Tiếng Nói Việt Nam

- Các loại sóng phát thanh đang dùng của đài Đài Tiếng Nói Việt Nam

- Phát thanh tín hiệu tương tự tại Đài Tiếng Nói Việt Nam

- Một số tiêu chuẩn phát thanh số đang được thử nghiệm

1.2 Giới thiệu tổng quan về Đài Tiếng Nói Việt Nam

Đài Tiếng Nói Việt Nam là đài phát thanh quốc gia, là cơ quan thuộc Chính phủ, thực hiện chức năng thông tin, tuyên truyền đường lối, chính sách của Đảng và pháp luật của Nhà nước, góp phần nâng cao dân trí, phục vụ đời sống tinh thần của nhân dân bằng các chương trình phát thanh, truyền hình, phát thanh trên Internet và báo viết

Đài Tiếng nói Việt Nam viết tắt bằng tiếng Việt là Đài TNVN, có tên giao dịch quốc tế bằng tiếng Anh là: Voice of Vietnam, viết tắt là VOV

Hiện nay Đài TNVN đã phủ sóng hầu hết ở 64 tỉnh thành và một phần các tỉnh trung du Bắc Bộ như: Hòa Bình, Sơn La, Yên Bái, Lạng Sơn, khu vực ven biển và gần

bờ từ Quảng Ninh đến Thanh Hóa Phủ sóng khu vực ven biển và gần bờ từ thành phố

Hồ Chí Minh đến mũi Cà Mau, Vịnh Thái Lan và một phần Biển Đông (Quần đảo Hoàng Sa, Quần đảo Trường Sa) Bản đồ phủ sóng được thể hiện ở Hình 1.1

1.2.1 Các kênh phát thanh

Hiện nay Đài TNVN đã tổ chức phát thanh trên các kênh từ VOV1 đến VOV6,

hệ thống VOV giao thông Quốc Gia ở Hà Nội và Thành Phố Hồ Chí Minh Cụ thể như

sau:

VOV1 (Kênh Thời sự): Từ ngày 1/1/2010, VOV1 phát sóng từ 05h00 đến 24h00

hàng ngày trên sóng ngắn, sóng trung và sóng FM phủ khắp cả nước

DUT.LRCC

Trang 17

Hình 1.1 Bản đồ phủ sóng phát thanh của Đài TNVN (nguồn Trung Tâm Kỹ Thuật

Phát Thanh VOV)

VOV2 (Kênh Văn hoá - Xã hội): Từ ngày 1/1/2010, VOV2 phát sóng từ 05h00

đến 24h00 hàng ngày trên sóng ngắn, sóng trung và sóng FM phủ khắp cả nước

VOV3 - One Radio (Kênh Âm nhạc): Phát sóng lần đầu tiên vào ngày 7/9/1990

trên tần số FM 100 MHz Năm 1995, VOV3 đổi sang tần số FM 102.7 MHz tại Hà Nội Ngày 20/9/2006, kênh có tên là Xone FM Từ ngày 1/3/2018, VOV3 đổi tên

DUT.LRCC

Trang 18

thành VOV3 - One Radio, nội dung đổi mới hoàn toàn, phủ sóng FM toàn quốc 24 giờ hàng ngày

VOV4 (Kênh phát thanh Dân tộc): Chính thức phát sóng từ ngày 1/10/2014

Hiện nay, VOV4 sản xuất và phát sóng bằng 11 tiếng dân tộc thiểu số Các chương trình của hệ VOV4 được phát trên sóng ngắn, sóng trung và sóng FM

VOV5 (Kênh phát thanh Đối ngoại): Phát sóng lần đầu tiên vào ngày 7/9/1945

Hiện nay, VOV5 sản xuất và phát sóng bằng 13 ngôn ngữ gồm cả tiếng Việt (dành cho đồng bào người Việt Nam ở nước ngoài) Các chương trình phát thanh của hệ VOV5 được phát trên sóng ngắn và sóng trung sang châu Âu, Bắc Mỹ, một phần Trung Mỹ, Đông Nam Á, Đông Bắc Á, một phần châu Phi và phát trong nước trên sóng FM tần số 105,5 MHz tại Hà Nội, sóng FM tần số 105,7 MHz tại thành phố

Hồ Chí Minh và tỉnh Quảng Ninh

VOV6 (Kênh Văn học - Nghệ thuật): VOV6 được Đài TNVN tái thành lập từ

tháng 2/2018 Hiện tại, VOV6 vẫn có kênh sóng và có website chung với VOV2, giờ phát sóng các chương trình vẫn ổn định như trước đây dành cho người Việt Nam và người nước ngoài phát sóng từ năm 1945

Hệ thống kênh VOV Giao thông Quốc gia (VOV GT) bao gồm kênh VOV GT

Hà Nội phát trên sóng FM tần số 91 MHz tại Hà Nội, kênh VOV GT TP.HCM phát

trên sóng FM tần số 91 MHz tại thành phố Hồ Chí Minh, kênh Mekong FM phát trên sóng FM tần số 90 MHz phủ sóng các tỉnh miền Tây Nam Bộ, kênh VOV Tiếng Anh

24/7 phát trên sóng FM tần số 104 MHz, kênh VOV FM 89 (Sức khoẻ Môi trường

An toàn thực phẩm) phát trên sóng FM tần số 89 MHz

1.2.2 Truyền hình

Bên cạnh phát thanh, Đài TNVN hiện có các kênh truyền hình sau:

Kênh VOV Vietnam Journey: Đây là kênh truyền hình chuyên biệt về văn hóa

và du lịch, được hình thành trên cơ sở hợp tác giữa Đài TNVN và Bộ Văn hoá, Thể thao và Du lịch

 Đài Truyền hình Kỹ thuật số VTC

DUT.LRCC

Trang 19

1.2.3 Báo chí

Báo chí là một trong những cơ quan ngôn luận quan trọng của Đài TNVN Hiện

có hai loại báo chí chính thức là báo điện tử trực tuyến VOV, VTC và báo Tiếng Nói Việt Nam in giấy

1.2.4 Phát thanh, truyền hình trên internet và điện thoại di động

Đài TNVN hiện đã triển khai một số ứng dụng internet và di động như:

VOV Media sử dụng trên các thiết bị di động Android và iOS Ứng dụng cung

cấp các tính năng nghe đài radio, xem truyền hình trực tuyến, đọc tin tức trên báo mạng điện tử của Đài

VOVTV là ứng dụng xem truyền hình cập nhật thường xuyên các chủ đề nóng,

cùng với các chương trình chuyên biệt

VTC Now là ứng dụng đặc biệt có kho sách nói đa dạng với hàng nghìn tác

phẩm và thường xuyên được cập nhật

1.3 Các loại sóng phát thanh đang dùng của Đài TNVN

Để đáp ứng phát thanh trong điều kiện địa hình phức tạp và đảm bảo tính đa dạng phong phú của các kênh, Đài TNVN sử dụng cả ba loại sóng phát thanh là sóng trung, sóng ngắn và sóng FM

1.3.1 Sóng trung

Phát thanh sóng trung được dùng phổ biến trên thế giới cũng như ở Việt Nam Theo sự phân chia của Hiệp hội viễn thông quốc tế (ITU), dải sóng trung từ 531 kHz đến 1602 kHz, và được chia thanh 120 kênh, mỗi kênh cách nhau 9 kHz Một số nước chọn khoảng các kênh là 10 kHz.Nước ta chọn khoảng các kênh là 9 kHz Sóng trung truyền lan theo hai phương thức là sóng đất (ground wave) và sóng trời (sky wave)

Sóng đất được truyền từ anten phát đến máy thu dọc theo mặt đất nên chủ yếu chịu ảnh hưởng của chất đất trong suốt đường truyền Cường độ trường sóng đất cũng phụ thuộc vào tần số phát của sóng Nó tăng khi tần số giảm và cũng tăng khi độ dẫn của đất tăng và ngược lại Sóng đất khá ổn định trong cả ngày, không phụ thuộc vào thời gian Miền phủ sóng của sóng đất từ vài chục km đến vài trăm km, nó phụ thuộc vào công suất máy phát, tần số công tác, độ dẫn điện của đất và môi trường truyền sóng

Sóng trời chủ yếu xuất hiện vào các giờ ban đêm Nó được hình thành nhờ sự phản xạ sóng từ tầng điện ly, vì vậy vùng phủ sóng của sóng trời từ vài chục đến hàng ngàn cây số tính từ nơi phát Cường độ trường của sóng trời không ổn định, luôn dao động, mức dao động có thể tới + - 10dB hoặc hơn nữa do nó phụ thuộc vào vào sự

DUT.LRCC

Trang 20

hình thành và cấu tạo của tầng điện ly Ðối với các máy công suất nhỏ ( <50 kW ), cường độ điện trường sóng trời rất nhỏ, không đáng kể

Vì tính không ổn định của cường độ trường sóng trời nên trong thực tế người ta coi vùng phủ sóng đất là vùng phủ sóng của sóng trung

Vùng phủ sóng trung của Ðài Tiếng nói Việt Nam gồm sóng

 675 kHz (VOV1) và sóng 549 kHz (VOV2) phủ các tỉnh đồng bằng Bắc Bộ và một phần các tỉnh trung du như: Hòa Bình, Sơn La, Yên Bái, Cao Bằng, Lạng Sơn, Quảng Ninh và miền duyên hải từ Thanh Hóa đến bắc Thừa Thiên Huế

 Sóng 630 kHz (VOV1) và sóng 729 kHz (VOV2) phủ từ nam Thừa Thiên Huế đến bắc Quảng Ngãi

 Sóng 648 kHz (VOV1) và sóng 738 kHz (VOV2) phủ toàn bộ tỉnh Bình Ðịnh

1.3.2 Sóng ngắn

Phát thanh sóng ngắn được hầu hết các hãng phát thanh lớn trên thế giới dùng chủ yếu cho phát thanh đối ngoại Ðối với các nước có địa hình phức tạp và rộng lớn, việc phát thanh bằng sóng trung và FM gặp khó khăn, người ta thường dùng sóng ngắn

bổ sung cho phát thanh đối nội

Việt Nam cũng dùng sóng ngắn để phủ sóng cho vùng núi phía Bắc, Tây Thanh Hóa, tây Nghệ An và các tỉnh Tây Nguyên

Sóng ngắn được Hiệp hội viễn thông quốc tế chia thành 13 sóng, đó là: 11, 13,

16, 19, 21, 25, 31, 41, 49, 60, 75, 90,và 120m (tần số từ 2300 kHz 26100 kHz) Ðối với một sóng được chia ra nhiều kênh(tùy thuộc vào dải tần của từng sóng), mỗi kênh cách nhau 5kHz

DUT.LRCC

Trang 21

Sóng FM được ITU qui định trong khuyến cáo ITU-R , BS412 từ 87,5 108MHz

và chia làm nhiều kênh Hiện tại Đài TNVN sử dụng khoảng cách kênh 100 kHz

Sóng FM là sóng truyền theo tầm nhìn từ anten thu Trong toàn dải sóng FM, các tính chất truyền lan sóng không phụ thuộc vào tần số, miền phủ sóng của sóng FM không đổi cả ngày lẫn đêm, khác rất nhiều so với truyền lan sóng trung và sóng ngắn Truyền lan sóng của FM phụ thuộc chủ yếu vào địa hình môi trường truyền sóng Miền phủ sóng giới hạn trong tầm nhìn, tuy nhiên bán kính phủ sóng có thể tăng khoảng 1,33 lần so với tầm nhìn quang học nhờ tính nhiễu xạ của chúng

1.4 Phát thanh tín hiệu tương tự tại Đài TNVN

Tại thời điểm hiện tại Đài TNVN vẫn đang phát sóng song song giữa tín hiệu tương tự và thử nghiệm một vài chuẩn phát thanh số Tuy nhiên đến giai đoạn hiện nay vẫn chưa thể triển khai một cách đầy đủ về phát thanh số cũng như chưa chọn được một chuẩn phát thanh số phù hợp ở Việt Nam do nhiều vấn đề như: kinh phí, cơ sở hạ tầng, máy thu thanh kỹ thuật số

1.4.1 Sơ đồ nguyên lý cơ bản phát thanh tín hiệu tương tự tại Đài TNVN

Cơ chế hoạt động của phát thanh tín hiệu tương tự của Đài TNVN đang được áp dụng hiện nay được tình bày trên sơ đồ Hình 1.2 Tín hiệu từ ba máy tính sẽ được truyền dẫn đến bộ chia chọn đường ra và chọn kiểm tra mức âm lượng cho các kênh

âm thanh, sau đó truyền đến bộ chuyển đổi tín hiệu sang tín hiệu tương tự Tiếp đến tín hiệu được truyền dẫn đến đầu phát vệ tinh rồi lên ăn-ten phát sóng Ở đây các thiết bị bao gồm:

Talia And Cos2000 là kiểm tra mức âm lượng và chuyển mạch tín hiệu âm

thanh giữa các máy tính nếu có sự cố

MUX DAC 700 là bộ chuyển đổi tín hiệu điện tử thành tương tự Chip DAC giữ

vai trò quyết định liệu có thể giải mã được với độ phân giải tối đa của tín hiệu (gồm tần số lấy mẫu và số bit trong một mẫu), độ chính xác cùng nhiều tính năng khác

DT7000 Earth Station là bộ đầu phát vệ tinh có nhiệm vụ truyền dẫn tín hiệu và

điều khiển các thông số cần thiết lên ăn-ten phát

DUT.LRCC

Trang 22

Hình 1.2 Sơ đồ nguyên lý phát thanh tín hiệu tương tự tại Đài TNVN

1.4.2 Ưu nhược điểm của phát thanh tín hiệu tương tự

Việc phát thanh tín hiệu tương tự có một số ưu điểm chính như sau:

 Hệ thống đơn giản, chi phí thấp và dễ sử dụng

 Lưu lượng tín hiệu tương tự không gặp bất cứ vấn đề gì về mạng hoặc rủi ro khi truyền tải

Tuy nhiên, việc phát thanh tín hiệu tương tự có nhiều khuyết điểm như:

 Tín hiệu dễ bị tác động dao động và điệp áp

 Phát thanh truyền hình phải xử lý tín hiệu ở nhiều mức, gây méo mó, nghẹt tiếng, sai màu

 Lẫn nhiều tạp âm không cần thiết

 Bị giảm chất lượng và có giới hạn về số lần sao chép

 Công nghệ hiện tại đã lỗi thời không đáp ứng được nhiều ứng dụng hiện nay

Vì những khuyết điểm như trên nên việc chuyển đổi phát thanh tín hiệu tương tự sang phát thanh theo công nghệ mới là hết sức cấp thiết

DUT.LRCC

Trang 23

1.5 Một số tiêu chuẩn phát thanh số đang được thử nghiệm tại Đài TNVN

Đài TNVN đang thử nghiệm một số tiêu chuẩn phát thanh sau:

 EUREKA 147 Digital Audio Broadcasting (DAB)

 Digital Radio Mondiale (DRM)

 Digital Multimedia Broadcasting (DMB)

1.5.1 Phát thanh số tiêu chuẩn EUREKA 147 (DAB)

Tiêu chuẩn này do EBU của Châu Âu đưa ra và được ITU công nhận là tiêu chuẩn cho phát thanh số (1992) Hệ thống làm việc ở dải tần số từ 30 MHz đến 3 GHz Hình 1.3 trình bày sơ đồ khối hệ thống phát DAB Chức năng cụ thể của các khối

 Khối OFDM sử dụng phương thức điều chế OFDM (Orthogonal Frequeney Division Multiplex) nhằm đáp ứng yêu cầu truyền dẫn dữ liệu tốc độ cao phù hợp với các máy thu di động, xách tay và cố định, đặc biệt là trong môi trường truyền sóng phức tạp Kiểu điều chế này được thực hiện bằng cách chia thông tin ra thành nhiều khoảng nhỏ, sử dụng sóng mang riêng trực giao nhau để mã hoá từng kênh, sau đó đưa chúng vào kênh truyền dẫn

DUT.LRCC

Trang 24

Hình 1.3 Sơ đồ máy phát thanh số chuẩn EUREKA 147

Hiện tại EUREKA 147 đưa ra bốn chế độ khác nhau để áp dụng trong từng

trường hợp cụ thể:

 Chế độ I: Thích hợp cho mạng phủ sóng trên mặt đất do một tần số trên băng

VHF, có khả năng lớn nhất cách ly các đài phát

 Chế độ II: Thích hợp cho sử dụng mạng một tần số ở khoảng giữa băng L và

cho phát thanh khu vực sử dụng một đài phát Khoảng tần số cách ly giữa các

đài phát lớn cho nên sự phân biệt thông tin giữa các đài phát cao và cho phép sử

dụng anten hữu hướng

 Chế độ III: Thích hợp với phương thức truyền qua cáp, qua vệ tinh, phủ sóng

mặt đất cho vùng lõm Do đó có thể làm việc tại các tần số tới 3 GHz phục vụ

tốt cho thu di động Phương thức này cho phép di pha lớn nhất

 Chế độ IV: Cũng áp dụng cho băng L, cho phép giãn cách không gian giữa các

đài phát trong mạng một tần số lớn Đồng thời ít bị ảnh hưởng khi thu trên xe ô

tô chạy với tốc độ cao

DUT.LRCC

Trang 25

1.5.2 Phát thanh số tiêu chuẩn DRM

Sơ đồ máy phát thanh số theo tiêu chuẩn DRM được trình bày trên Hình 1.4 Tiêu chuẩn này đáp ứng những ràng buộc trong phát thanh trong các kênh ở dải tần dưới 30 MHz, tốc độ bit cho mã hoá nguồn nằm trong khoảng từ 8 kbps (với các kênh có độ rộng phổ tần thấp) tới 20 kbps (với kênh HF tiêu chuẩn) và tối đa là tới 48 kbps (Gộp kênh)

Khối mã hoá nguồn dựa trên chuẩn nén âm thanh số MPEG-4 AAC (Advanced Audio Coding), có các công cụ mã hóa kênh chống lỗi cao dùng chung cho cả phát thanh mono và stereo

Hình 1.4 Sơ đồ khối máy phát thanh số theo tiêu chuẩn DRM

1.5.3 Phát thanh số tiêu chuẩn DMB

DMB là tiêu chuẩn do hệ thống phát thanh truyền hình Hàn Quốc KBS giới

thiệu Phương án này được các chuyên gia trong lĩnh vực truyền thông rất quan tâm,

có thể nói đây là bước đột phá về công nghệ phát thanh trong lĩnh vực truyền thông đại chúng hiện nay Với sự ra đời của công nghệ mới đặc biệt là công nghệ DMB, ranh giới giữa phát thanh truyền hình truyền thống và phát truyền thông đa phương tiện sẽ

bị xoá mờ

Công nghệ DMB thực chất là sự phát triển mới của phương thức phát thanh qua

di động với việc cung cấp hình ảnh chất lượng cao, âm thanh số và các dữ liệu

đa dạng kèm theo DMB là sự chắt lọc các điểm mạnh của hệ thống phát thanh số EUREKA 147 và hoàn toàn tương thích với hệ thống DAB của Châu Âu

DUT.LRCC

Trang 26

DMB được thiết kế để cung cấp dịch vụ đa phương tiện nhắm đến đối tượng khách hàng di động Với hệ thống DMB, khách hàng có thể thu được các chương trình truyền hình, phát thanh và các dịch vụ dữ liệu khác khi di chuyển với tốc độ cao như trên ôtô, tầu hoả, xe điện… Do được phát triển từ hệ thống phát thanh số E147 nên việc thiết lập hệ thống DRM tương đối đơn giản, chỉ cần bổ sung thêm thiết bị mã hoá video và hệ thống thiết bị phát thanh số E147 hiện có

1.6 Kết luận chương 1

Tóm lại, chương này đã trình bày tổng quan về Đài TNVN, các loại sóng phát thanh đang được sử dụng của Đài cũng như nguyên lý phát thanh tín hiệu tương tự đang được vận hành Ngoài ra, các chuẩn phát thanh số hiện đại đang được thử nghiệm tại Đài cũng đã được trình bày khái quát, bao gồm chuẩn EUREKA 147 (DAB), DRM, DMB

Tất cả các tiêu chuẩn phát thanh thử nghiệm trên đây đều sử dụng mã hóa nén âm thanh số theo chuẩn MPEG Đây là trọng tâm nghiên cứu của luận văn và chi tiết sẽ lần lượt được trình bày trong các chương tiếp theo: chương 2 trình bày lý thuyết về mã hóa tín hiệu âm thanh- là cơ sở lý thuyết cho các chuẩn nén âm thanh MPEG cụ thể sẽ được phân tích trong chương 3 Cuối cùng, chương 4 sẽ trình bày các thí nghiệm đánh giá các chuẩn MPEG về hiệu năng và chất lượng, nhằm lựa chọn được chuẩn nén phù hợp và tập tham số nén phù hợp

DUT.LRCC

Trang 27

Chương 2: LÝ THUYẾT MÃ HÓA NÉN ÂM THANH 2.1 Giới thiệu chương

Để làm nền tảng cho việc nghiên cứu về các kỹ thuật mã hóa nén âm thanh cụ thể, chương này sẽ tập trung hệ thống hóa lý thuyết cơ bản về tín hiệu âm thanh và chuyển đổi tín hiệu âm thanh tương tự sang số, hay còn gọi là số hóa tín hiệu âm thanh Phần số hóa tín hiệu âm thanh bao gồm số hóa dạng không nén và số hóa dạng nén

Các nội dung chính trong chương này như sau:

- Lý thuyết cơ bản về âm thanh

- Kỹ thuật số hóa tín hiệu âm thanh không nén

- Lý thuyết cơ bản về nén âm thanh số và giới thiệu một số định dạng âm thanh số phổ biến

2.2 Lý thuyết cơ bản về âm thanh

Âm thanh là các dao động cơ học của các phân tử, nguyên tử hay các hạt làm nên vật chất và lan truyền trong vật chất như các sóng Đối với thính giác của người, âm thanh là sự dao động của các phân tử không khí, lan truyền trong môi trường, va đập vào màng nhĩ, làm rung màng nhĩ và kích thích vùng thính giác của não cảm nhận âm thanh Môi trường lan truyền âm thanh có thể là không khí, nước hoặc chất rắn

Phần này trình bày về các đặc trưng của âm thanh nói chung và âm thanh tương

tự nói riêng

2.2.1 Âm thanh

Âm thanh được đặc trưng bởi các đại lượng vật lý sau đây:

Tốc độ lan truyền âm thanh: trong bất kỳ vật chất nhất định nào, âm thanh

không thay đổi tốc độ khi rời khỏi nơi nó xuất phát Tốc độ âm thanh phụ thuộc vào môi trường truyền âm, cụ thể là âm thanh di chuyển trong nước nhanh hơn

4 lần so với trong không khí; trong sắt hay thép, tốc độ của âm thanh nhanh khoảng 15 lần so với trong không khí Môi trường vật chất nào mà khoảng cách giữa các phần tử càng ngắn thì tốc độ của âm thanh càng cao Trong không khí, tốc độ của âm thanh khoảng 340m/s Tốc độ này thay đổi rất ít theo nhiệt độ, độ

ẩm và áp suất không khí, trừ khi các yếu tố này ảnh hưởng tới tính chất vật lý của không khí

Tần số âm thanh: là số lần dao động của không khí truyền dẫn âm trong một

giây Tần số dao động của âm thanh nghe thấy nằm trong dải tần 20 Hz - 20 kHz

DUT.LRCC

Trang 28

Áp suất âm thanh (còn gọi là thanh áp):là chênh lệch áp suất áp suất của vùng không khí khi bị sóng âm thanh tác động so với áp suất khí quyển trung bình Đơn vị đo áp suất âm thanh là Pascal [Pa], trong đó 1 Pa = 1 N/m2 Trong thực

tế, người ta biểu thị thanh áp với đơn vị đo là dB, là áp suất hiệu dụng p so với một giá trị tham chiếu p0 (là ngưỡng nghe của tai người ở tần số 1kHz):

L=20lg( p / p0) (2.1)

Tốc độ dao động âm: khi có tác động của sóng âm thanh, các phần tử không

khí dao động xung quanh vị trí cân bằng của nó Tốc độ dao động của các phần

tử không khí do tác động của âm thanh gọi là tốc độ dao động âm (ký hiệu là v

[m/s])

Công suất âm thanh: là năng lượng âm thanh đi qua đơn vị diện tích S [m2]

trong khoảng thời gian một giây Công suất âm thanh ký hiệu là P [W] và có thể

tính bằng công thức:

P= pvS (2.2)

Cường độ âm thanh: là lượng năng lượng được sóng âm truyền đi trong một

đơn vị thời gian qua một đơn vị diện tích 1 cm2

đặt vuông góc với phương

truyền âm Cường độ âm thanh ký hiệu là I [W/m2] và có thể tính bằng công thức:

I = P

S = pv (2.3)

2.2.2 Sự cảm thụ âm thanh của tai người

Tai người có thể nghe được âm thanh trong dải tần số từ 20 Hz đến 20 kHz Tai người có thể phân biệt được 130 mức thanh áp khác nhau, mỗi mức cách nhau 1

dB Tai người nghe nhạy với các âm thanh có tần số nằm trong khoảng 500 Hz đến

5000 Hz Các loại âm thanh mà tai người nghe được bao gồm:

Tiếng nói: là âm thanh phát ra từ miệng người nói, được truyền đi trong không

khí đến tai người nghe Dải tần số của tiếng nói đủ nghe rõ là từ 300 Hz đến

3400 Hz, là dải tần tiêu chuẩn áp dụng cho điện thoại Còn dải tần tiếng nói có chất lượng cao có thể là từ 200 Hz-7000 Hz, áp dụng cho các ampli hội trường

Âm nhạc: là âm thanh phát ra từ các nhạc cụ Dải tần số của âm nhạc là từ 20

Hz đến 15000 Hz

Tiếng động: là âm thanh phát ra từ sự va chạm giữa các vật

Tiếng ồn: là những âm không mong muốn

DUT.LRCC

Trang 29

Khi âm thanh lan truyền trong không khí sẽ bị ảnh hưởng bởi các yếu tố như:

Suy giảm năng lượng trên đường truyền lan: khi các nguồn âm có kích thước

nhỏ hơn nhiều so với bước sóng thì đều có thể coi là những nguồn âm điểm Với nguồn âm điểm: khi khoảng cách tăng gấp đôi thì thanh áp giảm đi một nửa hoặc mức thanh áp giảm đi 6 dB Khi có nhiều nguồn âm điểm nối tiếp nhau thành một tuyến đường sẽ tạo thành nguồn âm tuyến, khi khoảng cách tăng gấp đôi thì mức thanh áp giảm 3 dB Các nguồn âm có dạng như một mặt phẳng thì gọi là nguồn âm diện Trong trường gần của các nguồn âm diện có mặt bức xạ mức âm hầu như không suy giảm theo khoảng cách

Ảnh hưởng của khí hậu, thời tiết: trên đường lan truyền, ngoài sự suy giảm

năng lượng, sóng âm còn bị mất mát năng lượng bởi sự hấp thụ của môi trường không khí Cụ thể là tần số sóng âm càng cao thì độ suy giảm càng lớn, độ ẩm

và nhiệt độ không khí tăng thì sự suy giảm năng lượng âm lại bớt đi

Ảnh hưởng của hiện tượng nhiễu xạ: trên đường lan truyền trực tiếp từ nguồn

âm đến người nghe, sóng âm thường gặp phải các vật cản Như vậy, tương tự như ánh sáng, sẽ tạo nên những bóng âm Bóng âm chỉ hình thành khi các thành phần âm thanh với tần số có bước sóng nhỏ hơn kích thước của vật chắn Các thành phần âm thanh với tần số có bước sóng lớn hơn kích thước vật chắn gọi là hiện tượng nhiễu xạ sóng âm Như vậy, ở vùng phía sau một vật cản, âm sắc bị biến đổi vì chỉ nghe được thành phần tần số thấp Vật cản càng lớn thì âm sắc bị biến đổi càng nhiều

Ảnh hưởng của hiện tượng hấp thụ âm và phản xạ âm: trên đường lan truyền

của sóng âm, khi gặp các vật cản, một phần năng lượng bị hấp thụ vào vật cản (gọi là hiện tượng hấp thụ âm hay tiêu âm), một phần phản xạ trở lại môi trường truyền âm Trong một không gian khép kín, sóng âm sẽ phản xạ nhiều lần và tạo thành trường âm phản xạ Trường âm phản xạ xó ý nghĩa đặc biệt đối với sự cảm thụ âm thanh khi nghe trong trường âm tự nhiên cũng như trong trường âm nhân tạo, nó tạo thành âm thanh quang cảnh, làm cho âm thanh trở nên sống động Chỉ khi nào âm phản xạ đến sau trực âm khoảng 50 ms trở lên thì tai ta mới nghe tách biệt được chúng khỏi trực âm

2.2.3 Tín hiệu âm thanh tương tự

Tín hiệu tương tự là tín hiệu liên tục, có thể biểu diễn dưới dạng đồ thị một đường cong liên tục Tín hiệu âm thanh nghe thấy là tín hiệu tương tự Tín hiệu tương

tự được đặc trưng bởi các thông số sau đây:

DUT.LRCC

Trang 30

Biên độ: là độ mạnh của tín hiệu (hay còn gọi là mức của tín hiệu), đơn vị là

decibel (dB) hay volts (V)

Tần số: là tốc độ thay đổi của tín hiệu trong một giây, hay số chu kỳ trong một

giây và được đo bằng đơn vị Hertz (Hz)

Pha: là tốc độ thay đổi quan hệ của tín hiệu đối với thời gian, được mô tả theo

độ (degree) hoặc radian

Trong một hệ thống phát thanh, tín hiệu âm thanh ở dạng sóng âm cần được biến đổi thành tín hiệu điện để xử lý trong các khối con bên trong hệ thống Thiết bị đảm nhiệm chức năng này là micro Khi có âm thanh tác động vào micro, sóng âm tạo ra rung động ở tấm màng bên trong micro Ngày nay trên thị trường bao gồm nhiều loại micro, được phân loại dựa trên cấu tạo như: micro như micro điện động, micro tụ, micro dải băng, v.v Trong đó hai mẫu micro được sử dụng nhiều nhất là:

Micro điện động: đây là loại micro được sử dụng phổ biến nhất, có mức giá

bán phải chăng cùng hiệu quả khá cao, phù hợp cho đa dạng mục đích khác nhau Micro điện động hoạt động dựa trên nguyên tắc dùng hiệu ứng từ trường

để thay đổi dòng điện Micro điện động có cường độ rộng, bền và dễ thích nghi với sự thay đổi của nhiệt độ, không cần cung ứng nguồn điện để hoạt động, nhỏ gọn Tuy nhiên dải tần âm thanh có độ nhạy tốt chỉ giới hạn trong khoảng dưới

10 kHz

Micro dạng tụ: loại micro này hoạt động dựa trên nguyên tắc thay đổi điện

dung khi có âm thanh tác động vào màng rung Loại micro này có độ nhạy rất cao, dải tần âm thanh rất rộng (20 Hz - 20kHz) và bắt âm thanh xác thực nên được dùng nhiều ở các phòng thu âm Tuy nhiên, giá cả có thể cao và kích thước lớn

Vị trí cuối cùng trong chuỗi truyền tải tín hiệu âm thanh trong một hệ thống phát thanh là loa Loa là thiết bị đảm nhận nhiệm vụ chuyển đổi các dao động điện thành dao động cơ học để tái tạo âm thanh nằm trong dải tần số tai người có thể nghe được Loa có nhiều loại khác nhau, dù thuộc loại nào thì trong loa đều có màng loa Màng loa được làm bằng chất liệu giấy, nhựa hoặc kim loại, có phần vành rộng gắn với viền treo Khi màng loa rung lên sẽ tác động làm cho vùng không khí phía trước loa chuyển động và tạo ra âm thanh

Nguyên lý làm rung màng loa là khác nhau đối với các loại loa khác nhau Chẳng hạn như với loa điện động dựa trên nam châm điện thì màng loa được gắn với cuộn dây Cuộn dây được định vị trong một khe hẹp có từ trường mạnh được sinh ra giữa hai cực của một nam châm vĩnh cửu Khi có dòng điện chạy qua cuộn dây thì xuất hiện

DUT.LRCC

Trang 31

lực hút và lực đẩy làm rung cuộn dây, kéo theo sự rung động của màng loa gắn với cuộn dây

2.3 Số hóa tín hiệu âm thanh

Hầu hết các tín hiệu âm thanh tự nhiên là ở dạng tương tự, trong khi các thiết bị lưu trữ và truyền tải âm thanh hiện nay được thực hiện dựa trên phương thức

số, cho nên việc chuyển đổi tín hiệu âm thanh tương tự sang số là một yêu cầu cần thiết Chất lượng tín hiệu tối đa của một hệ thống âm thanh số hầu như được quyết định toàn bộ ở bộ chuyển đổi tương tự sang số ADC (Analog-to-Digital Convertor) Các phần tử khác trong hệ thống chỉ có thể tái tạo tín hiệu một cách hoàn hảo chứ không thể cải thiện được chất lượng âm thanh tốt hơn tín hiệu số sau bộ ADC

Quá trình chuyển đổi tương tự - số đối với tín hiệu tương tự nói chung và tín hiệu

âm thanh nói riêng dựa vào kỹ thuật điều xung mã PCM (Pulse Code Modulation) bao gồm lọc trước để loại bỏ những tần số quá cao không thể số hóa được tại đầu vào, lấy mẫu để rời rạc hóa tín hiệu theo thời gian, lượng tử hóa để chuyển biên độ tín hiệu tương tự sang dạng rời rạc và cuối cùng là mã hóa để biểu diễn các giá trị biên độ rời rạc ở dạng số Chuỗi các bước chuyển đổi tương tự - số được trình bày trên Hình 2.1

Ở phần cuối của một hệ thống số, tín hiệu tương tự ban đầu sẽ được phục hồi từ chuỗi các mẫu rời rạc nhờ bộ chuyển đổi số sang tương tự DAC (Digital-to-Analog Convertor)

Hình 2.1 Quá trình chuyển đối tín hiệu tương tự sang tín hiệu số

2.3.1 Lấy mẫu

Lấy mẫu có thể được thực hiện cho các tín hiệu khác nhau trong hệ tọa độ không-thời gian, hoặc với các hệ tọa độ bất kỳ Đối với các tín hiệu khác nhau theo thời gian, ví dụ s(t), việc lấy mẫu được thực hiện bằng cách đo các giá trị của tín hiệu

s(t) ở những thời điểm cách đều nhau một khoảng thời gian là T Tđược gọi là chu

kỳ lấy mẫu Như vậy, tín hiệu sau khi được lấy mẫu được đưa ra bởi:

DUT.LRCC

Trang 32

s[n]=s(t) t=nT, với n=0,1,2, (2.4)

Về mặt toán học, có thể biểu diễn quá trình lấy mẫu lý tưởng bằng việc nhân hàm tín hiệu s(t) với chuỗi xung dirac tuần hoàn như Hình 2.2

Hình 2.2 Lấy mẫu lý tưởng

Vậy tín hiệu sau khi lấy mẫu và phổ tần số tương ứng có thể biểu diễn như sau:

(2.6)

ở đây f slà tần số lấy mẫu hay là số lượng mẫu trong một giây, hoặc f s=1/ T

Như vậy, từ công thức (2.6) suy ra phổ tần số của tín hiệu lấy mẫu là sự xếp chồng tuần hoàn của phổ của tín hiệu liên tục với chu kỳ f s như minh họa trên Hình 2.3

DUT.LRCC

Trang 33

Hình 2.3 Phổ của tín hiệu lấy mẫu

Như vậy, các tín hiệu liên tục có tần số giới hạn có thể được tái tạo hoàn toàn từ phiên bản mẫu của nó, nếu tần số lấy mẫu lớn hơn gấp đôi tần số tối đa > Đây là nội dung chính của định lý lấy mẫu Nyquist-Shannon, cung cấp điều kiện đủ (nhưng không phải lúc nào cũng cần thiết) để có thể tái tạo tín hiệu liên tục từ các mẫu rời rạc

Trong thực tế, việc tạo ra một hàm delta lý tưởng như Hình 2.2 là không thể, mà

là hàm xung dirac được thay thế bằng một xung chữ nhật có độ rộng 0 Việc lấy mẫu được thực hiện bởi một mạch lấy mẫu và giữ mẫu để duy trì giá trị của mẫu không đổi trong khoảng thời gian bằng độ rộng xung 0 Hình 2.4 cho thấy một ví

dụ về tín hiệu lấy mẫu (t) (đường nét liền) được thu bằng một mạch lấy mẫu và giữ

Trang 34

Hình 2.4 Quá trình lấy mẫu thực tế

2.3.2 Lượng tử hóa

Lượng tử hoá là quá trình xấp xỉ các giá trị của tín hiệu lấy mẫu bằng bội số của

một giá trị q (q gọi là bước lượng tử) Nếu q không thay đổi thì quá trình lượng tử hóa

gọi là tuyến tính Quá trình này thực hiện bằng hàm bậc thang mô tả như Hình 2.5

Hình 2.5 Hàm lượng tử hóa với bước lượng tử q = 1 2.3.3 Mã hóa

Mã hóa là quá trình biến đổi các mẫu rời rạc lượng tử hóa thành các từ mã số gọi

là từ mã PCM Có thể dùng mã nhị phân hoặc mã Gray để biểu diễn từ mã PCM Như vậy, mã hóa ở đây chỉ nhằm thay đổi dạng biểu diễn độ lớn của các mẫu tín hiệu rời rạc lượng tử hóa Đối với tín hiệu âm thanh, đặc biệt là tiếng nói, việc mã hóa có thể tuân theo chuẩn PCM G.711 Đây là một tiêu chuẩn mã hóa âm thanh do Hiệp hội Viễn thông quốc tế ITU (International Telecommunication Union) đề xuất năm 1972

và được dùng chủ yếu trong mã hóa tín hiệu điện thoại

s a (t)

t

DUT.LRCC

Trang 35

PCM G.711 là phương pháp mã hóa trực tiếp tín hiệu lấy mẫu tiếng nói, âm thanh theo các luật lượng tử hóa µ-law hoặc A-law, trong đó:

A-law: biến đổi mỗi một từ mã âm thanh 13 bit có dấu thành một giá trị 8 bit có

dấu theo Bảng 2.1, ở đây s là bit dấu, các bit a g bị bỏ đi trong quá trình

µ -law: biến đổi mỗi một từ mã âm thanh 14 bit có dấu thành một giá trị 8 bit có

dấu theo Bảng 2.1, ở đây s là bit dấu, các bit a g bị bỏ đi trong quá trình

2.4 Lý thuyết cơ bản về nén âm thanh số

Đối với tín hiệu nói chung và tín hiệu âm thanh nói riêng, nén chính là kỹ thuật

mã hóa sử dụng số lượng bit ít hơn so với biểu diễn gốc của tín hiệu Có thể phân loại nén thành nén không có tổn hao và nén có tổn hao

2.4.1 Mã hóa nén không tổn hao

DUT.LRCC

Trang 36

Mã hóa nén không tổn hao cho phép khôi phục lại nguyên vẹn dòng bit thông tin biểu diễn tín hiệu gốc sau khi giải nén

Các thuật toán nén không tổn hao thường lợi dụng độ dư thừa thống kê trong dữ liệu để biểu diễn lại dữ liệu bằng cách loại bỏ độ dư thừa mà không làm mất mát thông tin Trong thực tế có nhiều loại dữ liệu có độ dư thừa thống kê khá lớn như ảnh, âm thanh, video Theo lý thuyết thông tin, những nguồn tin loại này có entropy thấp Do

đó việc mã hóa sẽ làm thay đổi cấu trúc thống kê của nguồn tin cho hợp lý hơn, nhằm gia tăng entropy của các ký tự dùng để mã hóa Do đó, mã hóa nén không tổn hao còn được gọi là mã hóa entropy

Sau đây là một số phương pháp mã hóa nén không tổn hao phổ biến:

Mã hóa Huffman: mã hóa Huffman là một thuật toán mã hóa entropy dựa trên

xác suất xuất hiện của các ký tự nguồn Mã hóa Huffman mã hóa từng ký tự nguồn thành một từ mã tương ứng theo quy luật: gán từ mã ngắn hơn cho các

ký tự nguồn có xác suất xuất hiện cao (nghĩa là xuất hiện thường xuyên hơn) và ngược lại Mã hóa Huffman có ưu điểm là hệ số nén tương đối cao, phương pháp thực hiện tương đối đơn giản, đòi hỏi ít bộ nhớ Tuy nhiên nhược điểm của mã Huffman là phải chứa cả bảng mã vào tập tin nén thì phía nhận mới có thể giải mã được, do đó hiệu suất nén chỉ cao khi ta thực hiện nén các tập tin

lớn

Mã hóa số học: mã hóa số học không mã hóa từng ký tự nguồn đơn lẻ mà mã

hoá cả một chuỗi các ký tự nguồn: toàn bộ chuỗi này được mã hóa thành một con số đơn, đó là số thập phân q nằm trong khoảng từ 0.0 < q < 1.0 Một nhánh con của mã hóa số học là mã hóa số học không đối xứng đạt được tốc độ mã

hóa nhanh hơn so với Huffman

Mã hóa Lempel-Ziv-Welch (LZW): LZW là một phương pháp nén được phát

minh bởi Lempel, Zip và Welch Nó hoạt động đựa trên một ý tưởng rất đơn giản là người mã hoá và người giải mã cùng xây dựng bảng mã Bảng mã này không cần được lưu kèm với dữ liệu trong quá trình nén, mà khi giải nén, người giải nén sẽ xây dựng lại Do vậy, thông tin về bảng mã không cần kèm theo dữ liệu nén, tuy nhiên nhược điểm của thuật toán là tốn nhiều bộ nhớ khi thực thi

nén/giải nén và khó thực hiện với nguồn dữ liệu dung lượng thấp

2.4.2 Mã hóa nén có tổn hao

DUT.LRCC

Trang 37

Về cơ bản, mã hóa nén âm thanh có tổn hao có thể phân làm hai loại là mã hóa băng con và mã hóa cảm quan

Mã hóa băng con: đây là phương pháp mã hóa âm thanh dựa trên nguyên tắc

mã hóa miền tần số Nghiên cứu thử nghiệm cho thấy độ nhạy của tai khác nhau

đối với các thành phần tần số khác nhau, nhiễu lượng tử rất ít ảnh hưởng đến tai người nghe ở miền tần số thấp, nên có thể lợi dụng điều này để mã hóa tín hiệu

âm thanh với số bit khác nhau cho mỗi băng con Ta có thể mã hóa tín hiệu ở băng tần thấp bằng ít bit còn tín hiệu ở miền tần số cao được mã hóa bằng nhiều bit hơn, dẫn đến kết quả là giảm được số bit trung bình Ở đây, tín hiệu được

phân chia thành nhiều dải băng hẹp riêng biệt nhờ một giàn lọc hay biến đổi

Fourier rời rạc DFT (Discrete Fourier Transform) để tạo thành một bộ mã hóa băng con SBC (Sub - Band Coder) Tín hiệu trong miền thời gian ứng với mỗi dải băng con được mã hóa độc lập Một ví dụ về mã hóa băng con đang được sử dụng hiện nay là mã hóa ITU-T G.722, mã hóa tín hiệu từ 0 - 7 kHz, phân chia tín hiệu thành 2 băng con, cho tốc độ bit của tín hiệu mã hóa là 64/56/48 kbps Các hãng sản xuất đầu compact disc cũng đã thành công với việc mã hóa phân chia 32 băng con đối với tín hiệu hi-fi 20 kHz Bộ mã hóa chuẩn wave lấy mẫu với tần số 44.1 kHz yêu cầu 16 bit trên một mẫu nhưng bộ mã hóa băng con

trên cơ sở DFT thì chỉ yêu cầu trung bình 2 bit trên một mẫu

Mã hóa cảm quan: đây là loại mã hóa dựa trên lợi dụng những đặc điểm tâm lý

cảm nhận âm thanh ở tai người Thuật toán chỉ mã hóa những thành phần mà tai người nghe được, những thành phần dưới ngưỡng nghe hoặc bị che khuất bởi tín hiệu khác thì không được mã hóa Mã hóa cảm quan có thể được kết hợp với

mã hóa băng con và mã hóa entropy để đạt được yêu cầu cao về tỷ lệ nén và chất lượng nén Điển hình cho nhóm chuẩn mã hóa này là các chuẩn MP3 (Moving Picture Experts Group 1 – Layer 3) và AAC (Moving Picture Experts Group 2 – Advanced Audio Coding) sẽ được trình bày chi tiết trong chương

tiếp theo

2.5 Các định dạng âm thanh thực tế

Hiện nay âm thanh được lưu trữ đa dạng với nhiều định dạng khác nhau Nhưng nhìn chung có ba kiểu định dạng cơ bản gồm dạng số gốc, dạng số nén không có tổn hao và dạng nén có tổn hao

2.5.1 Định dạng âm thanh số gốc

DUT.LRCC

Trang 38

Đây là kiểu định dạng âm thanh số sử dụng kỹ thuật PCM như đã trình bày ở mục 2.3, gồm định dạng WAV và AIFF

Định dạng WAV: là chuẩn định dạng tập tin âm thanh do IBM và Microsoft

phát triển năm 1991 để lưu trữ dữ liệu âm thanh trên máy tính cá nhân chạy hệ

điều hành Windows

Định dạng AIFF: AIFF được phát triển bởi Apple cho các máy Mac của mình

Ngoài ra AIFF còn có các phiên bản khác là AIFF-C và Apple Loops, được sử dụng bởi các phần mềm làm nhạc GarageBand và Logic Pro Tuy được thiết kế cho Mac, các máy Windows vẫn có thể sử dụng định dạng này một cách bình

thường

2.5.2 Định dạng âm thanh nén không tổn hao

FLAC (Free Lossless Audio Codec), ALAC( Apple Lossless Audio Codec) và APE (Monkey’s Audio), v.v là các loại định dạng nén âm thanh không tổn hao

Định dạng FLAC (Free Lossless Audio Codec): FLAC là một kỹ thuật nén âm

thanh không tổn hao, được thiết kế để lưu trữ âm thanh giống WAV nhưng được nén bằng các giải thuật khác nhau Thường thì một tệp định dạng FLAC

có cùng tần số lấy mẫu sẽ có dung lượng chỉ bằng 1/2 dung lượng của tệp WAV Thuật toán nén trong FLAC không gạt bỏ bất cứ một tín hiệu âm thanh nào nên hoàn toàn có thể giải nén từ một tệp FLAC ra thành một tệp WAV Cũng như các kỹ thuật nén nói chung, lợi ích lớn nhất của FLAC là làm giảm đáng kể nhu cầu về khả năng đường truyền và dung lượng lưu trữ Một tệp FLAC cho âm thanh stereo với chất lượng CD thì mỗi phút có dung lượng là

5MB

Định dạng ALAC (Apple Lossless Audio Codec): định dạng này là Real Audio

là định dạng độc quyền của Real Networks, được thiết kế chủ yếu cho nhạc phát

trực tuyến vì có mức nén cao

2.5.3 Định dạng âm thanh nén có tổn hao

WMA (Windows Media Audio), MP3 và AAC là các định dạng âm thanh nén có tổn hao phổ biến

Định dạng WMA: đây là chuẩn nén âm thanh được Microsoft phát triển, dùng

cho Windows Media Player, chất lượng tương đương MP3 với tốc độ bit thấp

hơn một nửa

Định dạng MP3: là một định dạng do tổ chức MPEG đề xuất và được ISO/IEC

ban hành, cung cấp chất lượng gần tương đương chất lượng CD ở tốc độ bit

DUT.LRCC

Trang 39

âm thanh truyền qua internet và lưu trữ tín hiệu âm thanh trong các thiết bị nghe

nhạc bỏ túi

Định dạng AAC: là một định dạng âm thanh đa năng được định nghĩa theo tiêu

chuẩn MPEG-2 và được phát triển bởi liên minh Fraunhofer, Dolby, Sony và AT&T Đây là một chuẩn nén mà hiện nay có thể áp dụng rất nhiều trong các lĩnh vực phát thanh truyền hình cũng như các dịch vụ âm thanh chất lượng cao

2.6 Kết luận chương 2

Trong toàn bộ nội dung Chương 2 chúng ta đã tìm hiểu khái quát về âm thanh cũng như quá trình chuyển đổi tín hiệu âm thanh tương tự sang tín hiệu âm thanh số Chương 2 cũng trình bày cơ sở lý thuyết giải thuật nén tín hiệu âm thanh Ở đây âm thanh dạng wave là dạng nguyên mẫu không nén nên chất lượng âm thanh là rất tốt Nhưng định dạng wave có nhược điểm lớn nhất là dung lượng tín hiệu rất lớn, dẫn đến không gian lưu trữ tín hiệu tăng và thời gian truyền dẫn tín hiệu lớn

Để giải quyết được vấn đề này chúng ta sẽ tiến hành mã hóa nén tín hiệu âm thanh dạng chuẩn wave sang MP3 và AAC và từ đó có thể đưa ra các đánh giá để ứng dụng thực tiễn vào Đài TNVN Cụ thể về các kỹ thuật mã hóa nén theo chuẩn MP3 và AAC sẽ được đề cập ở chương tiếp theo

DUT.LRCC

Trang 40

Chương 3: CÁC KỸ THUẬT MÃ HÓA NÉN ÂM THANH

3.1 Giới thiệu chương

Tiếp nối phần lý thuyết cơ bản về mã hóa nén tín hiệu âm thanh đã trình bày trong chương trước, chương này trình bày chi tiết các bước xử lý tín hiệu trong hệ thống mã hóa nén âm thanh số Về bản chất, âm thanh là tín hiệu tạo nên từ nhiều nguồn khác nhau gồm tiếng nói; âm thanh của các nhạc cụ như bộ gõ, bộ hơi, bộ dây (do gãy/kéo); các tiếng động từ sinh hoạt, sản xuất; âm thanh từ tự nhiên, v.v nên không thể mô hình hóa riêng cho từng nguồn âm thanh Thay vì tiếp cận dựa trên nguồn phát ra âm thanh, chúng ta chuyển hướng tiếp cận sang dựa vào cơ chế thu nhận

âm thanh, tức là dựa vào hệ thống thính giác ở người Mã hóa theo hướng này được gọi là mã hóa nén cảm quan, là loại mã hóa dựa trên lợi dụng những đặc điểm tâm lý cảm nhận âm thanh ở người

Nội dung chính chương này trình bày về các kỹ thuật mã hóa nén âm thanh MP3

và AAC Đây là những kỹ thuật mã hóa nén âm thanh được thực hiện dựa trên mô hình tâm lý cảm nhận âm thanh ở người, có kết hợp với kỹ thuật mã hóa băng con

Cụ thể là nội dung chính của chương bao gồm các vấn đề như sau:

- Mô hình tâm lý thính giác ở người

- Nguyên lý mã hóa cảm quan

- Kỹ thuật mã hóa nén âm thanh số theo chuẩn MP3

- Kỹ thuật mã hóa nén âm thanh số theo chuẩn AAC

- So sánh chuẩn mã hóa MP3 và AAC

3.2 Mô hình tâm lý thính giác ở người

Hệ thống thính giác ở người bao gồm tai và não, thu nhận âm thanh theo hai cơ chế là sinh lý và tâm lý Về mặt sinh lý, tai bao gồm tai ngoài, tai giữa và tai trong Mỗi bộ phận ở tai đảm nhiệm những chức năng khác nhau: tai ngoài tiếp nhận âm thanh rồi truyền qua ống tai và đưa vào màng nhĩ; tai giữa biến đổi sóng áp suất âm thanh thành chuyển động cơ học tác động lên các xương nhỏ; tai trong chứa ốc tai nằm trong một màng cơ sở, ốc tai chuyển đổi chuyển động cơ học ở xương tai giữa thành chuyển động ở màng cơ sở và kích thích các tế bào thần kinh thính giác ở đây rồi chuyển tín hiệu điện lên não

Về mặt tâm lý, sự cảm nhận âm thanh ở người liên quan đến một số hiệu ứng tâm

lý đặc biệt Chẳng hạn như đáp ứng của tai đối với một phân bố tần số cố định là khác nhau khi âm lượng thay đổi, ví dụ, âm trầm thì thường trở nên rõ hơn khi tăng âm

DUT.LRCC

Ngày đăng: 16/06/2021, 10:22

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm