Các công nghệ cơ sở của bộ codec tiếng trong thông tin di dộng

Chuyên đề: Thông tin vô tuyến Thuật ngữ viết tắtCDMA Code devision multiple access Đa truy nhập phân chia theo mãCELP Code excited linear prediction Dự đoán tuyến tính kích thích

Trang 1

MỤC LỤC

1

Trang 2

Chuyên đề: Thông tin vô tuyến Danh mục hình ve

DANH MỤC HÌNH VẼ

2

Trang 3

Ngày nay, với sự phát triển của kinh tế xã hội, con người phải thường xuyên trao đổi thông tin với nhau mọi lúc mọi nơi Điều này một phần dẫn đến nhu cầu sử dụng điện thoại di động tăng vọt trong những năm gần đây Do đó, ngành viễn thông là một trong những ngành phát triển nhất hiện nay Vậy, nhiệm vụ đặt ra cho ngành đối với mạng di động là gì? Đó là:

Sử dụng băng tần được cấp phát một cách hiệu quả để đạt được dung lượng cao do

sự hạn chế của dải tần vô tuyến sử dụng trong thông tin di động.

Đảm bảo chất lượng truyền dẫn yêu cầu, đảm bảo an toàn thông tin tốt nhất.

Giảm tối đa rớt cuộc gọi khi thuê bao di động chuyển từ vùng phủ này sang vùng phủ khác.

Trong đó, sử dụng hiệu quả băng tần là một nhiệm vụ hàng đầu Để tìm hiểu về vấn

đề này, chúng Em chọn đề tài “Các công nghệ cơ sở của bộ codec tiếng trong thông tin di dộng” Nội dung và phân công của chuyên đề như sau:

Chương I: Điều chế xung mã và điều xung mã vi sai thích ứng (P.V Tuấn)

Chương II: Bộ mã hóa theo cơ quan phát âm

2.3 Mã hóa tiếng ở các hệ thống thông tin di động CDMA (Q.V Tuyên)

Chương III: Kết luận

Do một số hạn chế về kiến thức nên chúng em còn nhiều thiếu sót, rất mong được quan tâm của thầy cô để chúng em có thể hiểu sâu hơn về đề tài này.

Chúng em xin chân thành cảm ơn PGS.TS Bùi Trung Hiếu đã hướng dẫn chúng em thực hiện đề tài này.

Nhóm sinh viên thực hiệnĐặng Văn TânQuách Văn Tuyên

3

Trang 4

Chuyên đề: Thông tin vô tuyến Lời nói đầu

Phan Việt Tuấn

4

Trang 5

5

Trang 6

Chuyên đề: Thông tin vô tuyến Thuật ngữ viết tắt

CDMA Code devision multiple access Đa truy nhập phân chia theo

mãCELP Code excited linear prediction Dự đoán tuyến tính kích thích

theo mãEVRC Enhanced variable rate code Bộ mã hóa tốc độ biến đổi

năng caoGSM Global system for mobile

communication Hệ thống thông tin di động toàn cầu

LPC Linear prediction coding Mã hóa dự đoán tuyến tính

RPE Regular pulse excitation Kích thích xung đều

VAD Voice Activity Detector Bộ phát hiện tiếng tích cực

DTX Discontinous Transmission Phát không liên tiếp

ACELP Algebraic Code Excited Linear

Prediction Dự báo tuyến tính xuất phát từ mã đại số

băng rộngPSTN Publick Switched Telephone

Network Mạng điện thoại chuyển mạch công cộng

6

Trang 7

Hình 1.2 lấy mẫu tín hiệu liên tục

b. Lượng tử hóa

Trang 8

Chuyên đề: Thông tin vô tuyến Chương I: Điều chế xung mã và xung mã

vi sai

Là quá trình làm tròn biên độ lấy mẫu tới mức lượng tử gần nhất có nghĩa là gáncho mỗi xung lấy mẫu một số nguyên phù hợp, mục đích của lượng tử hóa là để mãhóa giá trị mỗi xung lấy mẫu thành một từ mã có số lượng bit ít nhất

Có hai phương pháp lượng tử hóa là đều và không đều

Lượng tử hóa đều(như trong hình 1.3): khoảng động giá trị của tín hiệu vào (chính

là khoảng được giới hạn bởi biên độ lớn nhất và biên độ nhỏ nhất của tín hiệu đầuvào) được chia làm các khoảng đều nhau, mỗi khoảng là một bước lượng tử đều Δ.Các đường song song với trục thời gian là các mức lượng tử, sau đó làm tròn biên độxung lấy mẫu tới mức lượng tử gần nhất se nhận được xung lượng tử Tuy nhiên vớiphương pháp lượng tử này, tỷsố công suất tín hiệu có biên độ lớn trên công suất nhiễulượng tử se lớn hơn tỷ số công suất tín hiệu có biên độ yếu trên công suất méo lượng

tử Mà trong khi đó, tín hiệu thoại chỉ chủ yếu là các thành phần có cường độ yếu tạothành Vì vậy nó se làm giảm chất lượng tín hiệu thoại ở đầu thu, thực tế , phươngpháp này ít được sử dụng

Hình 1.3 lượng tử hóa đều

Lượng tử hóa không đều : trái với lượng tử hóa đều, lượng tử hóa không đều chiabiên độ xung lấy mẫu thành các khoảng không đều theo nguyên tắc khi biên độ xunglấy mẫu càng lớn thì độ dài bước lượng tử càng lớn như trong hình 1.4 lượng tử hóakhông đều được thực hiện bằng cách sử dụng bộ nén

Hình 1.4 lượng tử hóa không đều

Trang 9

c. Mã hóa – nén số

Chức năng của bộ mã hóa là chuyển đổi biên độ xung lượng tử thành một từ mãgồm một số bit nhất định Từ kết quả nghiên cứu và tính toán thì trong trường hợplượng tử hóa đều, biên độ xung cực đại của xung lấy mẫu tín hiệu thoại là 4096Δ Dođó mỗi từ mã phải chưa 12 bit dẫn tới tốc độ thoại lên tới gấp 1.5 lần tốc độ bit tiêuchuẩn là 64kbps Muốn nhận được tốc độ bit tiêu chuẩn, thường phải sử dụng bộ néncó đặc tính biên độ dạng logarit hay bộ nén analog Biểu thức toán học cho bộ nénanalog theo tiêu chuẩn châu Âu:

Trong đó A=87.6, x=Vvào/Vvào max và y=Vra/Vra max

Tuy nhiên do bộ nén analog tại phía mã hóa và bộ dãn analog tại phía giải mã chứacác diode bán dẫn nên gây ra méo phi tuyến Trong PCM sử dụng bộ mã hóa nén số

và bộ giải mã dãn số để loại trừ méo phi tuyến Sử dụng mã hóa nén số vừa đạt mụctiêu lượng tử hóa không đều lại vừa đạt được mỗi từ mã chỉ có 8 bit

Dựa vào đặc tính biên độ bộ nén analog luật A để xây dựng đặc tính biên độ bộ mãhóa – nén số bằng cách gần đúng hóa đường cong logarit thành 13 đoạn thẳng Vì vậyđặc tính biên độ của bộ mã hóa nén số có tên bộ mã hóa A = 87,6/13 Bộ mã hóa PCMnày được chuẩn hóa theo chuẩn ITU-T G.711

Hình 1.5 là đặc tính biên độ của bộ mã hóa nén số A=87,6/13 Nhánh âm đối xứngvới nhánh dương qua gốc tọa độ

Trên trục hoành đặt các giá trị của điện áp vào theo tỉ lệ logarit Giá trị điện áp vàođược ghi rõ trên hình Trục tung đặt các giá trị điện áp ra tương ứng và được chia làm

8 đoạn bằng nhau mỗi đoạn có độ dài là 16 Δ Trên trục hoành của chia làm 8 đoạnmỗi đoạn gồm 16 bước lượng tử bằng nha (Δi với I là số thứ tự đoạn) Biên độ mỗi

bước lượng tử Δi được xác định dựa vào quy luật biên độ bước lượng tử của đoạn saulớn gấp đôi biên độ bước lượng tử của đoạn trước liền kề

Trang 10

1.1.2 Chuyển đổi tín hiệu số thành tín hiệu tương tự.

Tại phìa thu, tín hiệu số PCM được chuyển đổi thành tín hiệu Analog qua hai bước:giải mã và lọc

Hình 1.6 Quá trình chuyển đổi D/A

a. Giải mã

Là quá trình ngược lại với mã hóa Trong giải mã, bắt đầu bằng việc tách mã nhịphân 8 bit từ tín hiệu PCM ( trong hình 2.1 tượng trưng từ mã 3 bit) Tiếp theo chuyển

Trang 11

đổi từ mã nhị phân thành một xung lượng tử có biên độ tương ứng với số lượng tử củatừ mã đó.

Hình 1.7 Quá trình giải mã PCM

Tín hiệu xung đã được lượng tử hóa ở đầu phát được tạo lại ở đầu thu Tín hiệuxung sau khi được giải mã có biên độ chênh lệch với biên độ xung mẫu tại phía phát.Hiện tượng này gọi là méo lượng tử và phát sinh do làm tròn biên độ khi lượng tử hóa

b. Lọc

Tín hiệu xung lượng tử được đưa qua bộ lọc thong thấp.Đầu ra bộ lọc này nhậnđược tín hiệu Analog là tín hiệu lien tục theo thời gian nhờ nội suy giữa các mẫu kếtiếp nhau

Hình 1.8 Quá trình lọc tín hiệu từ các xung PAM

1.2 ĐIỀU CHẾ XUNG MÃ VI SAI THÍCH ỨNG (ADPCM).

Đây là phương pháp mã hóa khá quan trọng, có nhiều ưu điểm, được ITU-T tiêuchuẩn hóa trong khuyến nghị G721, và có nhiều ứng dụng trong thực tế như hệ thống

Trang 12

tử hóa từ các mẫu bit này Tín hiệu ước lượng được cộng vào tín hiệu vi phân lượng tửhóa này để hồi phục dạng tín hiệu Cả hai tín hiệu hồi phục và tín hiệu vi phân lượng

tử hóa thực hiện nhờ bộ phỏng đoán tương thích ( adaptive predictor) có tác dụng ướclượng tín hiệu vào và hoàn thành vòng lặp

1.2.2 Giải mã ADPCM

Hình 1.10 Giải mã ADPCM

Khối giải mã có cấu trúc gần giống với phần hồi tiếp của bộ mã hóa Cùng với khốibiến đổi ngược từ PCM đồng dạng thành PCM luật A hoặc µ64kbps và khối điều

Trang 13

chỉnh để tránh tích lũy méo xuất hiện khi mã hóa đồng bộ Tandem Điều chỉnh mãPCM phía ra sao cho méo lượng tử trong bước tiếp theo là nhỏ nhất.

Trang 14

Chuyên đề: Thông tin vô tuyến Chương III: Kết luận

CHƯƠNG II:

BỘ MÃ HÓA THEO CƠ QUAN PHÁT ÂM

Nghiên cứu về cách tạo ra tiếng nói của con người là lĩnh vực rất hấp dẫn Trongquá khứ cũng có nhiều nỗ lực nhằm tạo ra máy nói nhưng kết quả thu được là rấtkhiêm tốn Nhờ công nghệ hiện đại mà ngày nay chúng ta có thể tạo ra tiếng nói tổnghợp một cách tự nhiên

Một cách tiếp cận rất thành công dựa trên cơ quan phát âm của con người bằng hệthống “Vocoder” Thuật ngữ vocoder là từ ghép của từ voice và từ coder nghĩa là cácphương pháp mã hóa có mối quan hệ trực tiếp với cách tạo ra tiếng nói của con người.Nguyên lí của vocoder se được trình bày trong phần sau

2.1.1 Cách tạo ra tiếng nói của con người

Tiếng nói là sản phẩm của sự phối hợp của phổi, thanh môn (với dây thanh âm: bộphận phát ra tiếng của thanh quản) và các bộ máy phát âm như miệng và khoang mũi.Hình 2.1 mô tả cơ quan phát âm của con người

Để tạo ra âm hữu thanh thì phổi se đẩy khí qua nắp thanh quản, các dây thanh âmdao động (đóng hoặc mở) gần như tuần hoàn với một chu kì gọi là chu kì pitch Tùythuộc vào từng người thì chu kì này có sự nhanh chậm khác nhau Đối với phụ nữ vàtrẻ em dưới 10 tuổi chu kì này thường ngắn tức là tốc độ dao động nhanh trong khi đốivới nam giới ở tuổi trưởng thành thì chu kì này thường lớn hơn

Các xung pitch kích thích khí trong miệng và khoang mũi và khi xảy ra cộng hưởngthì chúng tạo nên sóng âm hay tín hiệu tiếng Tần số cộng hưởng này được gọi là tần

Trang 15

khác nhau

Hình 2.1 Cơ quan phát âm của con người

Trong trường hợp âm vô thanh, các dây thanh âm không dao động nhưng luôn luôn

mở và tín hiệu kích thích của vùng thanh âm gần như một nhiễu

Hình dạng của vùng thanh âm (vocal tract bao gồm họng, miệng, khoang mũi)quyết định âm thanh mà chúng ta muốn nói Khi chúng ta nói, hình dạng của nó sethay đổi theo những âm thanh khác nhau, tốc độ thay đổi của nó là tương đối chậm (cỡ

10 đến 100ms)

2.1.2 Mã hóa dự đoán tuyến tính (LPC).

Dựa trên mô hình tạo giọng nói đơn giản, thuật toán mã hóa tiền dự đoán tuyến tínhLPC là một trong những thuật toán được chuẩn hóa sớm nhất làm việc ở tốc độ thấp

Bộ coder LPC FS1015, cho tốc độ bit 2.4kbps, là một bước tiến trong phát triển mãhóa tiếng nói, mặc dù chất lượng âm thanh được giải mã là thấp, nhưng nó có thể chấpnhận được

Được phát triển cho các ứng dụng trong quân sự về truyền tin bảo mật, bộ coderFS1015 được đặc trưng bởi tín hiệu giọng nói đầu ra nhân tạo của nó Hầu hết các bộcoder hiện đại dựa trên LP – linear prediction đều đạt được hiệu quả cao khi so với các

bộ coder khác khi cùng tốc độ bit, nguyên lý hoạt động của chúng kế thừa từ LPC, vàcó thêm các cải tiến nhằm cải thiện chất lượng và hiệu quả mã hóa Tiền dự đoántuyến tính là một công cụ rất quan trọng trong xử lí số tín hiệu Nó cung cấp chochúng ta một kỹ thuật rất mạnh để ước lượng các thông số của một đoạn tiếng nói nhưpitch, tần số formant, phổ dựa trên các giá trị đã biết trước đó của các thông số với

độ chính xác cao và tốc độ tính toán nhanh.Vì vậy, hiểu về LPC se giúp có có nhìn chitiết về các bộ coder phức tạp hơn

Trang 16

Chuyên đề: Thông tin vô tuyến Chương III: Kết luậnTrong phần này, mô hình mà bộ coder LPC sử dụng se được giới thiệu.

LPC dựa trên một mô hình tạo tiếng nói đơn giản như trong hình 2.2 mô tả Môhình này giúp quan sát các thuộc tính cơ bản của tín hiệu giọng nói và cố gắng bắtchước phương thức tạo giọng nói của con người Dưới đây là một mô hình đơn giản

Hình2.2 Mô hình tạo tiếng nói đơn giản

Giả sử mẫu hiện tại của tín hiệu được dự đoán từ M mẫu trước đó hay:

Do đó ,sai số giữa mẫu hiện tại và mẫu dự đoán được xác định như sau:

2 2

Trang 17

mẫu là đủ lớn thì tính chất của tín hiệu cơ bản vẫn giữ nguyên Mô hình vocal tract đã

cố định thời gian của một frame là 20 hoặc 30ms Nếu tín hiệu được lấy mẫu 8000mẫu/s và chiều dài của mỗi frame là 20ms thì trong 1 frame có 160 mẫu

Nếu N mẫu được đánh x0), x(1), , x(N-1) thì phương trình (5) có thể biểu diễn

thành dạng ma trận như sau:

(6)

Với

1 0

Từ phương trình (2) ta có thể thiết lập bộ lọc phân tích với x(n) là đầu vào, ε( )n làđầu ra như hình dưới đây

Hình 2.3 Bộ lọc phân tích

Hàm truyền đạt được cho bởi: 1

i i

Trang 18

Chuyên đề: Thông tin vô tuyến Chương III: Kết luận

Trong bất kì hệ thống tế bào vùng rộng nào như GSM, phổ tần là tài nguyên quí giá

và phải được sử dụng một cách hiệu quả Trong trường hợp truyền tiếng nói, điều nàyđặt ra yêu cầu là thông tin tiếng nói phải được truyền trên giao diện vô tuyến với tốc

độ càng thấp càng tốt song vẫn phải đảm bảo chất lượng tiếng nói thỏa mãn Điều nàycó nghĩa là các bộ mã hóa dạng song, như là ADPCM 32 kb/s là không thích hợp choGSM vì yêu cầu tốc độ bít khá cao của chúngTa chỉ xét các nguyên tắc cơ bản của bộ

mã hóa toàn tốc GSM và các đặc điểm chính của nó

Tại MS, tiếng nói của người dùng được biến đổi thành tín hiệu điện tương tự bằngmicro trước khi đi qua bộ lọc thông thấp Sau đó được đưa đến bộ biến đổi A/D đểđược mã hóa PCM đồng đều với tần số lấy mẫu 8 kHz và mỗi mẫu 13bit Cuối cùng,tín hiệu được chuyển tới bộ mã hóa tiếng nói của GSM

Nếu tín hiệu lấy từ mạng PSTN thì trước hết cần phải biến đổi PCM luật A 8 bitthành PCM đồng đều 13 bit.

Bộ mã hóa GSM thuộc họ các bộ mã hóa dự báo tuyến tính kích thích xung đềuRPE-LPC Nó còn sử dụng dự báo dài hạn LTP bổ xung cho dự báo ngắn hạn STPthông thường, vì thế được gọi là bộ mã hóa tiếng nói RPE-LTP Bộ mã hóa này có thểchia thành 4 phần: tiền xử lí, lọc phân tích LPC, lọc phân tích LTP và tính toán RPE

Hình 2.5 Sơ đồ khối bộ mã hóa tiếng GSM

2.2.1 Tiền xừ lý

Trang 19

chia thành các đoạn 20ms/160 mẫu/13kbps trước khi đưa tới đầu vào của bộ mã hóa.

2.2.2 Lọc phân tích LPC

Do phần trước ta đã xét đến bộ LPC nên phần này ta chỉ đi vào những phần chính.Dữ liệu tiếng nói vốn đã chứa mức dư thừa cao, có nghĩa là có thể dự đoán mẫutiếng nói tương lai từ các mẫu tiếng nói trước đó Theo thuật ngữ toán học ta có thểnói rằng mẫu tiếng nói có thể xấp xỉ bằng tổ hợp tuyến tính của 1 số mẫu tiếng nói quákhứ (8-16 mẫu) sao cho mẫu tiếng nói dự đoán tại thời điểm n cho bởi:

1

p k k

2.2.3 Lọc phân tích LTP.

Lọc tiếng nói bằng bộ lọc đảo A z( )có xu hướng loại bỏ nhiều độ thừa bằng cáchtrừ mỗi mẫu tiếng nói một giá trị dự đoán của nó dùng p mẫu quá khứ Tín hiệu nhận

Trang 20

Chuyên đề: Thông tin vô tuyến Chương III: Kết luậnđược được gọi là số dư dự đoán ngắn hạn và nói chung nó se có lượng chu kìnhất định liên quan đến chu kì pitch của tiếng nói gốc khi nó được phát âm Tínhchu kì này thể hiện mức dư thừa nữa mà ta có thể loại bỏ bằng bộ dự đoán pitch hay

bộ dự đoán dài hạn Dạng tổng quát của bộ lọc dự đoán dài hạn có dạng:

Các tham số G và α được lượng tử và mã hóa bằng 2 và 7 bít, tạo nên 9 bít trên 5

ms khối con và 36 bít trên khối 20 ms

2.2.4 Tính toán RPE.

Khử độ thừa khỏi tín hiệu tiếng nói tạo nên tín hiệu dư Trong bộ giải mãtiếng nói phần dư này được dùng để kích thích các bộ lọc STP và LTP tái thiết

Hệ thống GSM sử dụng phương pháp RPE để mã hóa một cách hiệu quả phần

dư Đối với mỗ đoạn con 5 ms, tín hiệu kích thích gồm 13 xung cách nhau bởi 3mẫu Biên độ và điểm xuất phát ban đầu của xung thứ nhất được tính toán nhằmgiảm thiểu sai số giữa tiếng nói và phiên bản khôi phục tại chỗ của nó Vớikhoảng cách xung là 3 mẫu, có 3 vị trí lưới có thể cho xung kích đầu tiên vàthông tin này được mã hóa bằng 2 bít Các biên độ xung được chuNn hóa theobiên độ cao nhất của khối và được lượng tử hóa bằng 3 bít Sau cùng, các giá trị

Định dạng
Số trang	26
Dung lượng	545,3 KB