1. Trang chủ
  2. » Công Nghệ Thông Tin

Nén âm thanh tiếng nói thoại theo chuẩn ITU

20 679 15

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 3,31 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Âm thanh (Sound) là các dao động cơ học của các phần tử, nguyên tử hay các hạt vật chất lan truyền trong không gian, được cảm nhận trực tiếp qua tai người bởi sự va đập vào màng nhĩ và kích thích bộ não. Sóng âm tần được đặc trưng bởi biên độ, tần số (bước sóng) và vận tốc lan truyền. Đối với tai người, âm thanh cảm nhận được bởi sóng có dao động trong dải tần từ 20Hz đến 20kHz. Tín hiệu âm thanh được chia thành 2 loại dựa trên dải tần: Âm thanh dải tần cơ sở (âm thanh tiếng nói thoại, gọi tắt là âm thanh thoại): có dải tần từ 300Hz đến 4kHz. Âm thanh dải rộng (tiếng nói trình diễn, hát, âm nhạc…): có dải tần số từ 100Hz đến 20kHz

Trang 1

XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN

10/4/2016

Giáo viên hướng dẫn : PGS.TS Nguyễn Thị Hoàng

Lan Sinh viên thực hiện : Phạm Thành Đạt – 20121503

Đỗ Xuân Cường – 20121358 Doãn Tuấn Vũ - 20122814

Trang 2

PHÂN CÔNG

Thành viên Nội dung

Phạm Thành Đạt Tìm hiểu một số khái niệm sound và đặc điểm của hai loại tín hiệu audio:

tín hiệu tiếng nói thoại và audio HiFi + Tìm hiểu các chuẩn ITU dùng trong các ứng dụng VOIP

Doãn Tuấn Vũ Phân tích một sơ đồ mã hóa tiếng nói thoại theo chuẩn ITU G726

Đỗ Xuân Cường Xây dựng thuật toán mã hóa theo sơ đồ phân tích trên, đặt thực nghiệm và

Trang 3

Khái niệm âm thanh

Âm thanh (Sound) là các dao động cơ học của các phần tử, nguyên tử hay các hạt vật chất lan

truyền trong không gian, được cảm nhận trực tiếp qua tai người bởi sự va đập vào màng nhĩ và kích thích bộ não Sóng âm tần được đặc trưng bởi biên độ, tần số (bước sóng) và vận tốc lan truyền Đối với tai người, âm thanh cảm nhận được bởi sóng có dao động trong dải tần từ 20Hz đến 20kHz Tín hiệu âm thanh được chia thành 2 loại dựa trên dải tần:

- Âm thanh dải tần cơ sở (âm thanh tiếng nói thoại, gọi tắt là âm thanh thoại): có dải tần từ 300Hz đến 4kHz

- Âm thanh dải rộng (tiếng nói trình diễn, hát, âm nhạc…): có dải tần số từ 100Hz đến 20kHz

Trang 4

Đặc điểm của các loại âm thanh

Một số đặc điểm của âm thanh được chỉ ra:

Âm thanh tiếng nói thoại Audio HiFi

- Giới hạn dải phổ tín hiệu 300Hz - 4kHz

- Tần số lấy mẫu fs = 8kHz tương đương với chu kỳ Te = 125µs

- Mỗi mẫu được mã hóa bởi 8bits

- Tốc độ cần thiết = 8bit x 8kHz = 64Kbit/s

- Giới hạn phổ tín hiệu: 20KHz

- Tần số lấy mẫu fs = 44.1 kHz , fs chuyên dụng: 48kHz

- Mỗi mẫu được mã hóa bởi 16bits

2 kênh stereo

- Tốc độ dữ liệu stereo: 176 Kbyte/s

Trang 5

Các chuẩn ITU dùng trong ứng dụng VOIP

 Sử dụng trên các thiết bị đường dây số

 G.711 ( a-law và u-law hàm lượng tử hóa của PCM ở tốc độ 64kbits/s)

 G.721 (ADPCM ở tốc độ 32 kbits/s)

 G.723 (ADPCM ở tốc độ 40, 24 kbits/s)

 G.726 (ADPCM ở tốc độ 16, 24, 32, 40 kbits/s)

 Sử dụng trên các thiết bị di động

 G.728 (tốc độ 16 Kbps, độ trễ < 2ms, chất lượng giống hoặc tốt hơn G.721)

 G.723.1 (CELP ở tốc độ 5.3 và 6.4 kbits/s)

 G.729 (CELP ở tốc độ 8 kbits/s)

 GMS 06.10 ( ở tốc độ 13 và 6.5 kbits/s)

Trang 6

Đặc điểm các chuẩn mã hóa nén tiếng nói

Encoder PCM MICDA RPE-LTP CELP CS-ACELP LPC

Đánh giá hiệu năng

(Standar) G.711 G.726 ETSI GMS06 -10 FS1016DOD G729 10 FS 1015DOD LPC Tốc độ sau nén

(Debit) 64 kbit/s 32 kbit/s 13kbit/s 4.8 kbit/s 8 kbit/s 2.4 kbit/s Chất lượng

Độ trễ

Trang 7

Thuật toán mã hóa ADPCM:

Trang 8

Khối biến đổi PCM đồng dạng

Trang 9

Khối biến đổi PCM đồng dạng

Trang 10

Khối lượng tử thích nghi

Trang 11

Khối lượng tử thích nghi

Trang 12

QUAN

Trang 13

 Đầu vào: DL, Quantizer scale factor –Y

 Đầu ra: DLN

 Có chức năng: Scale logarithmic version of difference signal by subtracting scale factor,

 DLN = (DL + 4096 − (Y >> 2)) & 4095

 Giá trị sau khi lượng tử của tín hiệu vi phân được truyền đến phía thu Một bộ lượng tử hóa thích ứng đảo tạo ra các tín hiệu vi phân lượng tử từ các mẫu bit này Tín hiệu ước lượng được cộng vào tín hiệu vi phân lượng tử để phục hồi lại dạng của tín hiệu Cả hai tín hiệu hồi phục và tín hiệu vi phân lượng tử được đưa vào bộ tiên đoán tương thích, có tác dụng ước lượng tín hiệu đầu vào và hoàn thành vòng lặp

Trang 14

Khối lượng tử hóa thích ứng đảo

Trang 15

Khối lượng tử hóa thích ứng đảo

Trang 16

Khối lượng tử hóa thích ứng đảo

Trang 17

Cài đặt thử nghiệm và đo lường hiệu năng:

 Demo sử dụng phần mềm Matlab để mô phỏng thuật toán mã hóa ADPCM

 Tín hiệu đầu vào là file âm thanh sp_encoded.wav

 alpha là hệ số dự đoán của bộ lọc thích ứng

 deltamin và deltamax là khoảng của bước lượng tử thích ứng

 nbits là số bit dùng để lượng tử

 Sau khi chạy chương trình, ta thu được phổ của tín hiệu lượng tử và tín hiệu lỗi với hệ số lỗi SNR=34.50 dB mã hóa cho 4 bit, với deltamin=16, deltamax=1600, hệ số alpha=0.8

Trang 18

Giao diện

Trang 19

Tính tỷ số nén

 Thử nghiệm trênMatlab sử dụng bộ CODEC theo chuẩn G 726(Sử dụng phương pháp mã hóa ADPCM)

 Tín hiệu đầu vào là file âm thanh input.wav , file thu được sau nén là file output.wav.

 File để mã hóa tín hiệu : adpcm_encoder.m.

 File để giải mã tín hiệu : adpcm_decoder.m

 Tính tỉ số nén : tinh_ty_so_nen.m.

Trang 20

CẢM ƠN CÔ VÀ CÁC BẠN ĐÃ LẮNG NGHE

Ngày đăng: 03/01/2017, 23:07

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w