Chuyên đề: Thông tin vô tuyến Thuật ngữ viết tắtCDMA Code devision multiple access Đa truy nhập phân chia theo mãCELP Code excited linear prediction Dự đoán tuyến tính kích thích
Trang 1MỤC LỤC
1
Trang 2Chuyên đề: Thông tin vô tuyến Danh mục hình ve
DANH MỤC HÌNH VẼ
2
Trang 3Ngày nay, với sự phát triển của kinh tế xã hội, con người phải thường xuyên trao đổi thông tin với nhau mọi lúc mọi nơi Điều này một phần dẫn đến nhu cầu sử dụng điện thoại di động tăng vọt trong những năm gần đây Do đó, ngành viễn thông là một trong những ngành phát triển nhất hiện nay Vậy, nhiệm vụ đặt ra cho ngành đối với mạng di động là gì? Đó là:
Sử dụng băng tần được cấp phát một cách hiệu quả để đạt được dung lượng cao do
sự hạn chế của dải tần vô tuyến sử dụng trong thông tin di động.
Đảm bảo chất lượng truyền dẫn yêu cầu, đảm bảo an toàn thông tin tốt nhất.
Giảm tối đa rớt cuộc gọi khi thuê bao di động chuyển từ vùng phủ này sang vùng phủ khác.
Trong đó, sử dụng hiệu quả băng tần là một nhiệm vụ hàng đầu Để tìm hiểu về vấn
đề này, chúng Em chọn đề tài “Các công nghệ cơ sở của bộ codec tiếng trong thông tin di dộng” Nội dung và phân công của chuyên đề như sau:
Chương I: Điều chế xung mã và điều xung mã vi sai thích ứng (P.V Tuấn)
Chương II: Bộ mã hóa theo cơ quan phát âm
2.3 Mã hóa tiếng ở các hệ thống thông tin di động CDMA (Q.V Tuyên)
Chương III: Kết luận
Do một số hạn chế về kiến thức nên chúng em còn nhiều thiếu sót, rất mong được quan tâm của thầy cô để chúng em có thể hiểu sâu hơn về đề tài này.
Chúng em xin chân thành cảm ơn PGS.TS Bùi Trung Hiếu đã hướng dẫn chúng em thực hiện đề tài này.
Nhóm sinh viên thực hiệnĐặng Văn TânQuách Văn Tuyên
3
Trang 4Chuyên đề: Thông tin vô tuyến Lời nói đầu
Phan Việt Tuấn
4
Trang 55
Trang 6Chuyên đề: Thông tin vô tuyến Thuật ngữ viết tắt
CDMA Code devision multiple access Đa truy nhập phân chia theo
mãCELP Code excited linear prediction Dự đoán tuyến tính kích thích
theo mãEVRC Enhanced variable rate code Bộ mã hóa tốc độ biến đổi
năng caoGSM Global system for mobile
communication Hệ thống thông tin di động toàn cầu
LPC Linear prediction coding Mã hóa dự đoán tuyến tính
RPE Regular pulse excitation Kích thích xung đều
VAD Voice Activity Detector Bộ phát hiện tiếng tích cực
DTX Discontinous Transmission Phát không liên tiếp
ACELP Algebraic Code Excited Linear
Prediction Dự báo tuyến tính xuất phát từ mã đại số
băng rộngPSTN Publick Switched Telephone
Network Mạng điện thoại chuyển mạch công cộng
6
Trang 7Hình 1.2 lấy mẫu tín hiệu liên tục
b. Lượng tử hóa
Trang 8Chuyên đề: Thông tin vô tuyến Chương I: Điều chế xung mã và xung mã
vi sai
Là quá trình làm tròn biên độ lấy mẫu tới mức lượng tử gần nhất có nghĩa là gáncho mỗi xung lấy mẫu một số nguyên phù hợp, mục đích của lượng tử hóa là để mãhóa giá trị mỗi xung lấy mẫu thành một từ mã có số lượng bit ít nhất
Có hai phương pháp lượng tử hóa là đều và không đều
Lượng tử hóa đều(như trong hình 1.3): khoảng động giá trị của tín hiệu vào (chính
là khoảng được giới hạn bởi biên độ lớn nhất và biên độ nhỏ nhất của tín hiệu đầuvào) được chia làm các khoảng đều nhau, mỗi khoảng là một bước lượng tử đều Δ.Các đường song song với trục thời gian là các mức lượng tử, sau đó làm tròn biên độxung lấy mẫu tới mức lượng tử gần nhất se nhận được xung lượng tử Tuy nhiên vớiphương pháp lượng tử này, tỷsố công suất tín hiệu có biên độ lớn trên công suất nhiễulượng tử se lớn hơn tỷ số công suất tín hiệu có biên độ yếu trên công suất méo lượng
tử Mà trong khi đó, tín hiệu thoại chỉ chủ yếu là các thành phần có cường độ yếu tạothành Vì vậy nó se làm giảm chất lượng tín hiệu thoại ở đầu thu, thực tế , phươngpháp này ít được sử dụng
Hình 1.3 lượng tử hóa đều
Lượng tử hóa không đều : trái với lượng tử hóa đều, lượng tử hóa không đều chiabiên độ xung lấy mẫu thành các khoảng không đều theo nguyên tắc khi biên độ xunglấy mẫu càng lớn thì độ dài bước lượng tử càng lớn như trong hình 1.4 lượng tử hóakhông đều được thực hiện bằng cách sử dụng bộ nén
Hình 1.4 lượng tử hóa không đều
Trang 9c. Mã hóa – nén số
Chức năng của bộ mã hóa là chuyển đổi biên độ xung lượng tử thành một từ mãgồm một số bit nhất định Từ kết quả nghiên cứu và tính toán thì trong trường hợplượng tử hóa đều, biên độ xung cực đại của xung lấy mẫu tín hiệu thoại là 4096Δ Dođó mỗi từ mã phải chưa 12 bit dẫn tới tốc độ thoại lên tới gấp 1.5 lần tốc độ bit tiêuchuẩn là 64kbps Muốn nhận được tốc độ bit tiêu chuẩn, thường phải sử dụng bộ néncó đặc tính biên độ dạng logarit hay bộ nén analog Biểu thức toán học cho bộ nénanalog theo tiêu chuẩn châu Âu:
Trong đó A=87.6, x=Vvào/Vvào max và y=Vra/Vra max
Tuy nhiên do bộ nén analog tại phía mã hóa và bộ dãn analog tại phía giải mã chứacác diode bán dẫn nên gây ra méo phi tuyến Trong PCM sử dụng bộ mã hóa nén số
và bộ giải mã dãn số để loại trừ méo phi tuyến Sử dụng mã hóa nén số vừa đạt mụctiêu lượng tử hóa không đều lại vừa đạt được mỗi từ mã chỉ có 8 bit
Dựa vào đặc tính biên độ bộ nén analog luật A để xây dựng đặc tính biên độ bộ mãhóa – nén số bằng cách gần đúng hóa đường cong logarit thành 13 đoạn thẳng Vì vậyđặc tính biên độ của bộ mã hóa nén số có tên bộ mã hóa A = 87,6/13 Bộ mã hóa PCMnày được chuẩn hóa theo chuẩn ITU-T G.711
Hình 1.5 là đặc tính biên độ của bộ mã hóa nén số A=87,6/13 Nhánh âm đối xứngvới nhánh dương qua gốc tọa độ
Trên trục hoành đặt các giá trị của điện áp vào theo tỉ lệ logarit Giá trị điện áp vàođược ghi rõ trên hình Trục tung đặt các giá trị điện áp ra tương ứng và được chia làm
8 đoạn bằng nhau mỗi đoạn có độ dài là 16 Δ Trên trục hoành của chia làm 8 đoạnmỗi đoạn gồm 16 bước lượng tử bằng nha (Δi với I là số thứ tự đoạn) Biên độ mỗi
bước lượng tử Δi được xác định dựa vào quy luật biên độ bước lượng tử của đoạn saulớn gấp đôi biên độ bước lượng tử của đoạn trước liền kề
Trang 10Chuyên đề: Thông tin vô tuyến Chương I: Điều chế xung mã và xung mã
1.1.2 Chuyển đổi tín hiệu số thành tín hiệu tương tự.
Tại phìa thu, tín hiệu số PCM được chuyển đổi thành tín hiệu Analog qua hai bước:giải mã và lọc
Hình 1.6 Quá trình chuyển đổi D/A
a. Giải mã
Là quá trình ngược lại với mã hóa Trong giải mã, bắt đầu bằng việc tách mã nhịphân 8 bit từ tín hiệu PCM ( trong hình 2.1 tượng trưng từ mã 3 bit) Tiếp theo chuyển
Trang 11đổi từ mã nhị phân thành một xung lượng tử có biên độ tương ứng với số lượng tử củatừ mã đó.
Hình 1.7 Quá trình giải mã PCM
Tín hiệu xung đã được lượng tử hóa ở đầu phát được tạo lại ở đầu thu Tín hiệuxung sau khi được giải mã có biên độ chênh lệch với biên độ xung mẫu tại phía phát.Hiện tượng này gọi là méo lượng tử và phát sinh do làm tròn biên độ khi lượng tử hóa
b. Lọc
Tín hiệu xung lượng tử được đưa qua bộ lọc thong thấp.Đầu ra bộ lọc này nhậnđược tín hiệu Analog là tín hiệu lien tục theo thời gian nhờ nội suy giữa các mẫu kếtiếp nhau
Hình 1.8 Quá trình lọc tín hiệu từ các xung PAM
1.2 ĐIỀU CHẾ XUNG MÃ VI SAI THÍCH ỨNG (ADPCM).
Đây là phương pháp mã hóa khá quan trọng, có nhiều ưu điểm, được ITU-T tiêuchuẩn hóa trong khuyến nghị G721, và có nhiều ứng dụng trong thực tế như hệ thống
Trang 12Chuyên đề: Thông tin vô tuyến Chương I: Điều chế xung mã và xung mã
tử hóa từ các mẫu bit này Tín hiệu ước lượng được cộng vào tín hiệu vi phân lượng tửhóa này để hồi phục dạng tín hiệu Cả hai tín hiệu hồi phục và tín hiệu vi phân lượng
tử hóa thực hiện nhờ bộ phỏng đoán tương thích ( adaptive predictor) có tác dụng ướclượng tín hiệu vào và hoàn thành vòng lặp
1.2.2 Giải mã ADPCM
Hình 1.10 Giải mã ADPCM
Khối giải mã có cấu trúc gần giống với phần hồi tiếp của bộ mã hóa Cùng với khốibiến đổi ngược từ PCM đồng dạng thành PCM luật A hoặc µ64kbps và khối điều
Trang 13chỉnh để tránh tích lũy méo xuất hiện khi mã hóa đồng bộ Tandem Điều chỉnh mãPCM phía ra sao cho méo lượng tử trong bước tiếp theo là nhỏ nhất.
Trang 14Chuyên đề: Thông tin vô tuyến Chương III: Kết luận
CHƯƠNG II:
BỘ MÃ HÓA THEO CƠ QUAN PHÁT ÂM
Nghiên cứu về cách tạo ra tiếng nói của con người là lĩnh vực rất hấp dẫn Trongquá khứ cũng có nhiều nỗ lực nhằm tạo ra máy nói nhưng kết quả thu được là rấtkhiêm tốn Nhờ công nghệ hiện đại mà ngày nay chúng ta có thể tạo ra tiếng nói tổnghợp một cách tự nhiên
Một cách tiếp cận rất thành công dựa trên cơ quan phát âm của con người bằng hệthống “Vocoder” Thuật ngữ vocoder là từ ghép của từ voice và từ coder nghĩa là cácphương pháp mã hóa có mối quan hệ trực tiếp với cách tạo ra tiếng nói của con người.Nguyên lí của vocoder se được trình bày trong phần sau
2.1.1 Cách tạo ra tiếng nói của con người
Tiếng nói là sản phẩm của sự phối hợp của phổi, thanh môn (với dây thanh âm: bộphận phát ra tiếng của thanh quản) và các bộ máy phát âm như miệng và khoang mũi.Hình 2.1 mô tả cơ quan phát âm của con người
Để tạo ra âm hữu thanh thì phổi se đẩy khí qua nắp thanh quản, các dây thanh âmdao động (đóng hoặc mở) gần như tuần hoàn với một chu kì gọi là chu kì pitch Tùythuộc vào từng người thì chu kì này có sự nhanh chậm khác nhau Đối với phụ nữ vàtrẻ em dưới 10 tuổi chu kì này thường ngắn tức là tốc độ dao động nhanh trong khi đốivới nam giới ở tuổi trưởng thành thì chu kì này thường lớn hơn
Các xung pitch kích thích khí trong miệng và khoang mũi và khi xảy ra cộng hưởngthì chúng tạo nên sóng âm hay tín hiệu tiếng Tần số cộng hưởng này được gọi là tần
Trang 15khác nhau
Hình 2.1 Cơ quan phát âm của con người
Trong trường hợp âm vô thanh, các dây thanh âm không dao động nhưng luôn luôn
mở và tín hiệu kích thích của vùng thanh âm gần như một nhiễu
Hình dạng của vùng thanh âm (vocal tract bao gồm họng, miệng, khoang mũi)quyết định âm thanh mà chúng ta muốn nói Khi chúng ta nói, hình dạng của nó sethay đổi theo những âm thanh khác nhau, tốc độ thay đổi của nó là tương đối chậm (cỡ
10 đến 100ms)
2.1.2 Mã hóa dự đoán tuyến tính (LPC).
Dựa trên mô hình tạo giọng nói đơn giản, thuật toán mã hóa tiền dự đoán tuyến tínhLPC là một trong những thuật toán được chuẩn hóa sớm nhất làm việc ở tốc độ thấp
Bộ coder LPC FS1015, cho tốc độ bit 2.4kbps, là một bước tiến trong phát triển mãhóa tiếng nói, mặc dù chất lượng âm thanh được giải mã là thấp, nhưng nó có thể chấpnhận được
Được phát triển cho các ứng dụng trong quân sự về truyền tin bảo mật, bộ coderFS1015 được đặc trưng bởi tín hiệu giọng nói đầu ra nhân tạo của nó Hầu hết các bộcoder hiện đại dựa trên LP – linear prediction đều đạt được hiệu quả cao khi so với các
bộ coder khác khi cùng tốc độ bit, nguyên lý hoạt động của chúng kế thừa từ LPC, vàcó thêm các cải tiến nhằm cải thiện chất lượng và hiệu quả mã hóa Tiền dự đoántuyến tính là một công cụ rất quan trọng trong xử lí số tín hiệu Nó cung cấp chochúng ta một kỹ thuật rất mạnh để ước lượng các thông số của một đoạn tiếng nói nhưpitch, tần số formant, phổ dựa trên các giá trị đã biết trước đó của các thông số với
độ chính xác cao và tốc độ tính toán nhanh.Vì vậy, hiểu về LPC se giúp có có nhìn chitiết về các bộ coder phức tạp hơn
Trang 16Chuyên đề: Thông tin vô tuyến Chương III: Kết luậnTrong phần này, mô hình mà bộ coder LPC sử dụng se được giới thiệu.
LPC dựa trên một mô hình tạo tiếng nói đơn giản như trong hình 2.2 mô tả Môhình này giúp quan sát các thuộc tính cơ bản của tín hiệu giọng nói và cố gắng bắtchước phương thức tạo giọng nói của con người Dưới đây là một mô hình đơn giản
Hình2.2 Mô hình tạo tiếng nói đơn giản
Giả sử mẫu hiện tại của tín hiệu được dự đoán từ M mẫu trước đó hay:
Do đó ,sai số giữa mẫu hiện tại và mẫu dự đoán được xác định như sau:
2 2
Trang 17mẫu là đủ lớn thì tính chất của tín hiệu cơ bản vẫn giữ nguyên Mô hình vocal tract đã
cố định thời gian của một frame là 20 hoặc 30ms Nếu tín hiệu được lấy mẫu 8000mẫu/s và chiều dài của mỗi frame là 20ms thì trong 1 frame có 160 mẫu
Nếu N mẫu được đánh x0), x(1), , x(N-1) thì phương trình (5) có thể biểu diễn
thành dạng ma trận như sau:
(6)
Với
1 0
Từ phương trình (2) ta có thể thiết lập bộ lọc phân tích với x(n) là đầu vào, ε( )n làđầu ra như hình dưới đây
Hình 2.3 Bộ lọc phân tích
Hàm truyền đạt được cho bởi: 1
i i
Trang 18Chuyên đề: Thông tin vô tuyến Chương III: Kết luận
Trong bất kì hệ thống tế bào vùng rộng nào như GSM, phổ tần là tài nguyên quí giá
và phải được sử dụng một cách hiệu quả Trong trường hợp truyền tiếng nói, điều nàyđặt ra yêu cầu là thông tin tiếng nói phải được truyền trên giao diện vô tuyến với tốc
độ càng thấp càng tốt song vẫn phải đảm bảo chất lượng tiếng nói thỏa mãn Điều nàycó nghĩa là các bộ mã hóa dạng song, như là ADPCM 32 kb/s là không thích hợp choGSM vì yêu cầu tốc độ bít khá cao của chúngTa chỉ xét các nguyên tắc cơ bản của bộ
mã hóa toàn tốc GSM và các đặc điểm chính của nó
Tại MS, tiếng nói của người dùng được biến đổi thành tín hiệu điện tương tự bằngmicro trước khi đi qua bộ lọc thông thấp Sau đó được đưa đến bộ biến đổi A/D đểđược mã hóa PCM đồng đều với tần số lấy mẫu 8 kHz và mỗi mẫu 13bit Cuối cùng,tín hiệu được chuyển tới bộ mã hóa tiếng nói của GSM
Nếu tín hiệu lấy từ mạng PSTN thì trước hết cần phải biến đổi PCM luật A 8 bitthành PCM đồng đều 13 bit.
Bộ mã hóa GSM thuộc họ các bộ mã hóa dự báo tuyến tính kích thích xung đềuRPE-LPC Nó còn sử dụng dự báo dài hạn LTP bổ xung cho dự báo ngắn hạn STPthông thường, vì thế được gọi là bộ mã hóa tiếng nói RPE-LTP Bộ mã hóa này có thểchia thành 4 phần: tiền xử lí, lọc phân tích LPC, lọc phân tích LTP và tính toán RPE
Hình 2.5 Sơ đồ khối bộ mã hóa tiếng GSM
2.2.1 Tiền xừ lý
Trang 19chia thành các đoạn 20ms/160 mẫu/13kbps trước khi đưa tới đầu vào của bộ mã hóa.
2.2.2 Lọc phân tích LPC
Do phần trước ta đã xét đến bộ LPC nên phần này ta chỉ đi vào những phần chính.Dữ liệu tiếng nói vốn đã chứa mức dư thừa cao, có nghĩa là có thể dự đoán mẫutiếng nói tương lai từ các mẫu tiếng nói trước đó Theo thuật ngữ toán học ta có thểnói rằng mẫu tiếng nói có thể xấp xỉ bằng tổ hợp tuyến tính của 1 số mẫu tiếng nói quákhứ (8-16 mẫu) sao cho mẫu tiếng nói dự đoán tại thời điểm n cho bởi:
1
p k k
2.2.3 Lọc phân tích LTP.
Lọc tiếng nói bằng bộ lọc đảo A z( )có xu hướng loại bỏ nhiều độ thừa bằng cáchtrừ mỗi mẫu tiếng nói một giá trị dự đoán của nó dùng p mẫu quá khứ Tín hiệu nhận
Trang 20Chuyên đề: Thông tin vô tuyến Chương III: Kết luậnđược được gọi là số dư dự đoán ngắn hạn và nói chung nó se có lượng chu kìnhất định liên quan đến chu kì pitch của tiếng nói gốc khi nó được phát âm Tínhchu kì này thể hiện mức dư thừa nữa mà ta có thể loại bỏ bằng bộ dự đoán pitch hay
bộ dự đoán dài hạn Dạng tổng quát của bộ lọc dự đoán dài hạn có dạng:
Các tham số G và α được lượng tử và mã hóa bằng 2 và 7 bít, tạo nên 9 bít trên 5
ms khối con và 36 bít trên khối 20 ms
2.2.4 Tính toán RPE.
Khử độ thừa khỏi tín hiệu tiếng nói tạo nên tín hiệu dư Trong bộ giải mãtiếng nói phần dư này được dùng để kích thích các bộ lọc STP và LTP tái thiết
Hệ thống GSM sử dụng phương pháp RPE để mã hóa một cách hiệu quả phần
dư Đối với mỗ đoạn con 5 ms, tín hiệu kích thích gồm 13 xung cách nhau bởi 3mẫu Biên độ và điểm xuất phát ban đầu của xung thứ nhất được tính toán nhằmgiảm thiểu sai số giữa tiếng nói và phiên bản khôi phục tại chỗ của nó Vớikhoảng cách xung là 3 mẫu, có 3 vị trí lưới có thể cho xung kích đầu tiên vàthông tin này được mã hóa bằng 2 bít Các biên độ xung được chuNn hóa theobiên độ cao nhất của khối và được lượng tử hóa bằng 3 bít Sau cùng, các giá trị