se Trễ xử lý gói Sau khi thực hiện xử lý số, hệ thống VoIP đặt vào bộ đệm các khung dữ liệu tiếng nói đã được mã hóa trước khi gói hóa để truyền đi.. Tuy nhiên, trong trường hợp thông t
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NĂNG
TRƯƠNG LÊ PHƯƠNG ANH
NANG CAO CHAT LƯỢNG THOẠI
TREN MANG IP BANG KY THUAT BU
MAT GOI
Chuyên ngành: Kỹ thuật điện tử
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng, năm 201 1
Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NANG
Người hướng dẫn khoa học: TS Phạm Văn Tuấn
Phản biện I: TS Ngô Văn Sỹ
Phản biện 2: TS Lương Hồng Khanh
Luận văn sẽ được bảo vệ trước Hội đồng cham Luan van tốt nghiệp Thạc sĩ ngành Kỹ thuật điện tử họp tại Đại học
Đà Nẵng vào ngày 26 tháng 06 năm 2011
Có thể tìm luận văn tại:
- _ Trung tâm Thông tin - Học liệu Đại học Đà Nẵng
- Trung tam Hoc liệu Dai học Da Nang
Trang 2MO DAU
1 TINH CAP THIET CUA DE TAI
Ngày nay, khi xã hội phát triển, nhu cầu liên lạc của con người càng
trở nên bùng nố và cấp thiết, các yêu cầu về loại hình dịch vụ thông tin
ngày càng phong phú Tuy nhiên các dịch vụ này lại chiếm rất nhiều
băng thông đường truyền
Để sử dụng tài nguyên viễn thông một cách hiệu quả nhất, kỹ thuật
chuyển mạch gói đã ra đời Công nghệ này chia dữ liệu cần vận chuyển
thành các gói (hay các khung) có kích thước và định dạng xác định Mỗi
gói như vậy sẽ được vận chuyền riêng rẽ và đến nơi nhận bằng các đường
truyền khác nhau Khi toàn bộ các gói dữ liệu đã đến nơi nhận thì chúng
sẽ được hợp lại thành dữ liệu ban đầu
Tiết kiệm băng thông đường truyền và nâng cao chất lượng cuộc gọi
là điều quan trọng mà nhà cung cấp dịch vụ cần phải quan tâm Tuy
nhiên, khi truyền thoại trên mạng chuyển mạch gói, do thoại là dịch vụ
thời gian thực nên nó chỉ cho phép thời gian trễ và tỷ lệ mất gói thấp
Mất gói lớn xảy ra làm chất lượng cuộc gọi kém đi, gây khó chịu cho
khách hàng Vì vậy, việc nghiên cứu và áp dụng các biện pháp để nâng
cao chất lượng cuộc gọi trong mạng IP là điều rất cần thiết
2 MỤC ĐÍCH NGHIÊN CỨU
Đề tài tiến hành nghiên cứu tổng quan VolP; các yếu tố ảnh hưởng
chất lượng thoại, các nguyên nhân dẫn đến việc mất gói thoại; tìm hiểu
mô hình tạo tiếng nói, phân tích và áp dụng phương pháp bù mất gói
thoại để nâng cao được chất lượng dịch vụ
3 ĐÓI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tương nghiên cứu :
- _ Phương pháp xử lý tiếng nói
- _ Phương pháp bù mất gói đối với thoại trong mạng IP
4
Phạm vi nghiên cứu : Công nghệ VoIP và các tiêu chuẩn QoS liên quan
4 MỤC TIỂU NGHIÊN CỨU
Nghiên cứu để hiểu rõ các phương pháp bù mất gói
5 PHƯƠNG PHÁP NGHIÊN CUU
Về lý thuyết: Thu thập tài liệu để nghiên cứu các biện pháp bù mất gói để nâng cao chất lượng thoại
6 Ý NGHĨA KHOA HỌC VÀ THỰC TIẾN CỦA ĐÈ TÀI
- - Ứng dụng lý thuyết của kỹ thuật xử lý tín hiệu và các phương pháp
xử lý tiếng nói để nâng cao chất lượng truyền dẫn thoại
- Hỗ trợ hiểu biết cho bản thân với tư cách là một kỹ thuật viên vận hành hệ thống VoIP
7 KET CAU CUA LUAN VAN
Luận văn gỗm 4 chương:
CHƯƠNG 1 - TONG QUAN VoIP & CHAT LUONG TRUYEN
DAN THOAI TRONG MANG IP
1.1 GIOI THIEU VoIP
Céng nghé VoIP (Voice Over Internet Protocol) là công nghệ truyền thoại gói Nguyên tắc thoại trên IP bao gồm việc số hóa tiếng nói, tiếp
theo là nén tín hiệu số phù hợp, chia tín hiệu thành các gói dữ liệu, cuối
cùng là truyền các gói dữ liệu này trên mạng sử dụng công nghệ IP Đến
nơi nhận, các gói dữ liệu được tập hợp lại, tín hiệu dữ liệu nhận được giải
mã, sau đó được chuyển đổi thành tín hiệu tương tự để phục hồi âm thanh
1.2 LOLICH CUA VoIP 1.3 H.323 - TIEU CHUAN VAN CHUYEN TIENG NOI TREN
MANG IP 1.3.1 Khai niém H.323
1.3.2 Kiến trúc H.323
Trang 31.3.3 Các giao thức điều khiến, thiết lập cuộc gọi trong H.323
1.4 CHAT LUONG TRUYEN DAN THOAI TRONG MANG IP
Gateway là thiết bị trung gian giữa các mạng, thực hiện chức năng
“phiên dịch”, thực hiện xử lý DSP và gói hóa thoại Các gói thoại được
truyền linh hoạt trong mạng IP nhờ cơ chế hoạt động hiệu quả của các bộ
định tuyến (Router) Router nhận các gói thoại trên đường truyền, lần
lượt bóc tách các header và đọc địa chỉ IP mạng để xác định đường đi tối
ưu nhất tới đích
Vì được thực hiện nhiều quá trình xử lý tại Gateway (DSP, đóng
gói ) và phải qua nhiều Router trên đường truyền để đến đích nên thời
gian trễ của gói thoại lớn, điều này ảnh hưởng rất nhiều đến chất lượng
thoại Về bản chất, mang IP lai là mạng best-effort, nó không đảm bảo tin
cậy hoàn toàn, do vậy, mất gói luôn luôn có thê xảy ra
Để cung cấp thoại có chất lượng tốt nhất, ta cần quan tâm đến các
yếu tố ảnh hưởng chất lượng như: trễ, mất gói hay echo; từ đó đề ra các
phương thức giảm thiểu những ảnh hưởng này
1.4.1 Trễ
Trễ trong hệ thống VolP cơ bản từ hai nguồn: trễ do bản thân
Gateway gây ra và trễ do bản thân mạng dùng để kết nối hai Gateway
gây ra Vì trễ là tích lũy, do vậy, bất cứ thời gian trễ nào do các thành
phần của VolP gây ra sẽ trực tiếp ảnh hưởng đến tổng thời gian trễ toàn
hệ thống Trong VoIP, mục tiêu phấn đấu là thời gian trễ một hướng nhỏ
hơn 300 ms
Te! ele one 1s "5 SS
—— TT?acri gian tre ban than =——= —
Giao diện mạng
Hình 1.6 Hệ thông VolP điển hình
1.4.1.1 Tré do Gateway gay ra
Xử lý tín hiệu số Xử lý gói
PCM >| DSP coding [*7
Giao diện mạng
Bộ đệm và đóng Bộ đệm
201 Jitter
TCP/IP Ngăn xêp giao thức
4
Vv
Giao diện mạng Ethernet
|
- Hình 1.7 Quá trình xử ly cua Gateway t IP
se Tré giao dién mang
e Tré trong qua trinh xi Ly tín hiệu số
Xử lý tín hiệu số được thực hiện bằng phần cứng DSP chuyên dụng
hay kết hợp thuật toán phần mềm để thực hiện: nén/ giải nén tiếng nói,
phát hiện tone, phát hiện im lặng, tạo tone, tạo nhiễu dễ chịu và triệt echo trên từng khung tiếng nói Quá trình DSP thực hiện xử lý toàn bộ các
khung dữ liệu cùng một lúc
Thời gian trễ của quá trình xử lý số tùy thuộc vào kích thước khung (frame) đối với từng phương pháp mã hóa thoại
se Trễ xử lý gói Sau khi thực hiện xử lý số, hệ thống VoIP đặt vào bộ đệm các khung
dữ liệu tiếng nói đã được mã hóa trước khi gói hóa để truyền đi
Mỗi gói dữ liệu VoIP bắt đầu với 40 byte header của giao thức IP, UDP va RTP Header chira dia chi IP nguén/dich, s6 céng UDP, sé thir
Trang 47
tự gói và các thông tin cần thiết khác để truyền đữ liệu Sau header, có
một hay nhiều khung dữ liệu thoại mã hóa theo sau
Quyết định dồn nén nhiều khung dữ liệu vào một gói đơn là sự cần
nhắc quan trọng đối với mỗi hệ thống VoIP Nếu khung dữ liệu có kích
thước nhỏ hơn so với 40 byte header, thì cần đặt nhiều hơn một khung
thoại mã hóa vào mỗi gói IP để giảm lãng phí do header IP gây ra Tuy
nhiên, điều này gây thêm nhiều thời gian trễ do thêm thời gian của chu
kỳ khung khác
1.4.1.2 Trễ do mạng IP gây ra
1.4.2 Echo
1.4.3 Mat gói
Mang VoIP là mang không tin cậy về bản chất nên thường xảy ra
hiện tượng mắt gói Phần lớn nguyên nhân mắt gói có thể là:
- Mắt gói vì lỗi truyền dẫn Nếu checksum kiểm tra bị hỏng thì gói bị
loại bỏ
- Gói bị mất do nghẽn mạng (mạng quá tải) Nếu không đủ không
gian bộ đệm trong các Router, hàng đợi xảy ra hiện tượng tràn Một
Router thường có bộ đệm giao tiếp ở ngõ vào, bộ đệm hệ thống và bộ
đệm giao tiếp ở ngõ ra Mất gói ở ngõ vào thường xảy ra khi Router
không thể xử lý các gói đủ nhanh Mắt gói ở ngõ ra khi kết nối ở ngõ ra
quá bận
- Mất gói xảy ra do gói trải qua một thời gian trễ trên mạng quá lớn
và đến đích quá trễ
Đối với các ứng dụng không phải thời gian thực như truyền file hay
email , mất gói không quan trọng vì nó dùng cơ cấu phát lại Tuy nhiên,
trong trường hợp thông tin thoại thời gian thực, các gói đến phải nằm
trong cửa số thời gian thực tương đối hẹp để tái tạo tín hiệu tiếng nói Do
vay co cau phat lại thực sự không phù hợp
8
Sau đây là các kỹ thuật được sử dụng để hiệu chỉnh và khôi phục sự
mất gói Các kỹ thuật này sẽ được trình bày kỹ hơn trong chương 3 phía sau
se - Khôi phục các gói bị mất ở phía phát
- Media-independent FEC
- Media-dependent FEC: các gói thoại dự phòng được đi kèm với
các gói thoại khác để có thể thực hiện khôi phục gói bị mắt
- Một gói thoại được chia ra thành các unit nhỏ hơn và xếp xen kẻ
nhau trong các gói khác nhau
se - Khôi phục các gói bị mất ở phía thu
- Bên thu bù mắt gói bằng cách thay thế nhiễu nền vào vị trí các gói
bi mat hay lặp lại gói cuối cùng nhận được trong suốt khoảng thời gian khi gói bị mất
- Thực hiện ngoại suy hay nội suy gói bị mất từ các gói được nhận
trước hay gói nhận sau.| 12]
- Thực hiện tái tạo gói bị mất theo mô hình huấn luyện
Chương 1 đã trình bày một cách tổng quan về VoIP va cdc van dé cần quan tâm để nâng cao chất lượng tiếng nói trong mạng IP Tuy nhiên,
để có cơ sở thực hiện việc bù mất gói sẽ trình bày ở chương 3, ta cần hiểu thêm về cơ chế tạo tiếng nói và các kỹ thuật xử lý
Chương 2 sẽ trình bày mô hình tạo tiếng nói, các kỹ thuật trong xử lý tín hiệu tiếng nói và phương pháp mã hóa được img dung trong VoIP
CHƯƠNG 2 - KY THUAT XU LY TIENG NOI DUA TREN MA
HOA DU DOAN TUYEN TINH 2.1 QUA TRINH TAO TIENG NOI
> 2k EA ⁄⁄⁄⁄ 22224022277
Lirc tác động Ór các cơ-< = = 5 = : Se
phôi —— =—== ° —— ———- > Miéne
S 6, 1 _ — lưỡi ——
Trang 5Hình 2.2 Mô hình cơ học của cơ quan phát âm người
2.2 MÔ HÌNH DỰ ĐOÁN TUYẾN TÍNH
Hình 2.6 Mô hình toán học của việc tạo tiếng nói
Từ nguyên lý tạo tiếng nói người như trên, một mô hình toán học
(mô hình mã hóa dự đoán tuyến tính) được dùng để mô phỏng việc tạo
tiếng nói:[13]
Môi quan hệ giữa mô hình vật lý và mô hình toán học:
Bộ máy phát âm <=> H(2) ( Bộ lọc LPC)
Sự rung của dây thanh âm <=> V (Voiced)
Chu kỳ rung của dây thanh âm <=> T (Chu ky pitch)
Phụ âm sát và phụ âm bật <=> UV (Unvoiced)
Độ lớn không khí <=> G (Độ lợi)
2.3 FRAMING, OVERLAP-ADDING TRONG XU LY TIN HIEU
TIENG NOI
window
⁄ oN “ “oN y(n)
afl ald poi ers fla, A, Í
N: kích thước của frame N
Hinh 2.7 Phan tich tin hiéu thanh frame
2.4 PHUONG PHAP PHAN TICH MA HOA DU DOAN TUYEN TINH
Tín hiệu tiếng nói thay đổi theo thời gian Ứng với một đoạn tiếng nói ngắn (gọi là segment hay frame), tiếng nói được xem là tín hiệu dừng Nói
cách khác, mô hình bộ máy phát âm là không đổi trên mỗi segment Thông
thường, mỗi segment có chiều dài 20ms, nếu tiếng nói được lẫy mẫu tại tan s6 8kHz thi s6 mau trong 1 segment 14 160 mau
Xét mot frame tiéng nói: Đối với mô hình dự đoán tuyến tính trên, bộ máy phát âm được xem như bộ lọc toàn cực với đầu vào bộ lọc là một chuỗi nhiễu trắng hay là một dãy xung tựa tuần hoàn; đầu ra bộ lọc là
tiếng nói số Bộ lọc này là bộ lọc đệ quy nhưng chỉ lấy đầu vào là mẫu
âm kích thích hiện tại u(n) để tính thay vì lẫy m mẫu quá khứ của u(n) Tiếng nói đầu ra được mô tả bằng công thức:
M
k=l
Voi a, 1a hé số dự đoán tuyến tính M: bậc dự đoán Gọi s (n) là mẫu hiện tại của tiếng nói được dự đoán tuyến tính từ M
mâu quá khứ của tiêng nói
k=l Như vậy, sai lệch e(n) giữa mẫu tiếng nói thực và mẫu dự đoán: e(n) = s(n) — s(n) = s(n) — Sa, s(n —k) (2.4)
Do vậy, tổng của sai lệch dự đoán bình phương của cả frame:
E=Yie?(n) = Vs(n)- Ya, sin-WY
Trang 6II 12
2.4.1 Xác định các thông số bộ lọc và độ lợi
Đề xác định các hệ số bộ lọc dự đoán tuyến tính, ta phải tối thiểu hóa Hình 2.9 Thuật toán CELP
Hệ số bộ lọc a, (hệ số dự đoán tuyến tính) được giải bằng thuật toán
LP analysIs
2.4.2 Xác định Voiced/Unvoiced và xác định chu ky pitch s đebook
Quá trình mã hóa LPC sẽ tính toán và truyện đi các thông sô bộ lọc, Encoded bit stream of payload bytes
dâu hiệu xác định voiced/unvoiced và chu kỳ pitch của khung tiêng nói
đê mã hóa I khung là: 2400*0.02 = 48 bit
Divide into 4 subframes —_> xe
Adaptive Stochastic
.— LPC spectral Spectral codebook search codebook search 0110 Gain Gain l7 Decoded
- - analysis “| filtering ¬_ " —* parameters rd _| Synthesis samples
i Post Ly High-pass ›
codebook
, i Na Stochastic Speech <q“ Linear " excitation LSP
Trang 7
Hình 2.11 Bộ giải mã CELP
2.6 KÉT LUẬN CHƯƠNG
Chương này trình bày phương pháp phân tích tín hiệu tiếng nói Đây
là cơ sở thực hiện nâng cao chất lượng tiếng nói ở chương 3
CHƯƠNG 3 - CÁC PHƯƠNG PHÁP BÙ MÁT GÓI & ĐÁNH
GIA CHAT LUONG TIENG NOI 3.1 CAC KY THUAT PHUC HOI MAT GOI
Có hai kỹ thuật phục hồi mất gói: kỹ thuật phục hồi mất gói từ phía
phát và kỹ thuật bù mắt gói ở phía thu Hai phương pháp này đều cố gắng
phục hồi gói bị mắt để cho tiếng nói có chất lượng tốt nhất
3.1.1 Kỹ thuật phục hồi mắt gói từ phía phát
Kỹ thuật này có thể phân chia như theo hình dưới đây:[12]
Khôi phục mất gói ở phía phát
Ỷ
Ỷ
Redundacy Sửa lỗi FEC Xen kẻ gói Truyền lại
(Media dependent) (Media independent) gói
Hình 3.1 Phân loại kỹ thuật phục hôi mắt gói từ phía phát
3.1.1.1 Truyễn gói lại
3.1.1.2 Sửa lỗi phía trưóc (FEC-Forward Error Corection)
Network loss in FEC Block
MA
Seed
Hình 3.2 Cơ chế phục hồi FEC Voice packets >
| 1O,11,1Z | 11,122,153 | 12,13.14 | 13,14,15 | 14,15,16 | Redundancy=2
Redundancy=0
Redundancy=1
Additional delay—>
First | Second | taa6.16 | Redundancy=2
| 10,191.12 | 11.12.13 lost xxx lost xxx with lost packets
— _—
Recovered packets sequence b>
Hình 3.3 Ví dụ cơ chế phục hôi gói Redundancy 3.1.1.3 Kỹ thuật sắp xếp xen ké (Interleaving)
Dimmm
Original Stream
teh + = [6]
Interleaved Stream
Packet Loss
I:Is[sl [:I:IsI:] MM CT Dele
[> [io 0m:
Hinh 3.4 Vi du co ché sap xép xen ké
3.1.2 Kỹ thuật bù mắt gói từ phía thu
Kỹ thuật này tạo ra sự thay thế gói bị mất bởi gói tương tự nguyên
Reconstructed Stream
bản
3.1.2.1 Bù mất gói bằng kỹ thuật chèn (Insertion)
Trang 8Cơ chê khôi phục mật gói này có các loại:
Voice packets ©
15
16 17
11 | 12 | 13 | 14 | 15 ' Lost Lost! 18 | 19 | 20
(a) — Các gói nhận được có chỉ thi mat oi |
11 | 12 | 13 14 |15INhiễu Nhiều! 18 | 19 | 20
(b) — Khôi phục bằng thay thế nhigunén
(c) Khôi phục băng lặp lại gói trước đó
Hình 3.5 Kỹ thuật phục hồi mắt gói từ phía thu theo cơ chế chèn
3.1.2.2 Bù mắt gói dựa vào mô hình LP
Kỹ thuật này dùng mô hình dự đoán tuyến tính LP (Linear
Prediction) của quá trình tạo tiếng nói
Past samples
x(n)
Vv
Prediction
filter
A
b>
yr
LP analysis
Pitch
»/ detector
yr
Pitch period P
y
^
e(n) Excitation e(n)
> generator >
Residual
signal
LP coefficients
a(i)
Synthesis filter
Reconstructed
sigh al
x(n)
|
Hình 3.6 Sơ đồ khối thuật toán bù mắt gói dựa vào mô hinh LP
Theo mô hình LP tín hiệu tiếng nói x(n) gồm hai thành phân:
- Thông số dự đoán chứa thông tin bộ máy phát âm
16
- Tín hiệu dư thừa (sai lệch) chứa thông tin về tín hiệu kích thích
Tiéng nói được tạo ra bang cách cho tín hiệu kích thích đi qua một bộ
loc tong hop (bộ máy phát âm) Phương pháp bù này được thực hiện hoàn toàn từ bên thu đối với tín
hiệu PCM Nguyên tắc cơ bản của thuật toán này là ước tính hệ so LP
{a()} và tín hiệu kích thích {e(n)} của gói (frame) tiếng nói bị mat dựa
vào thông tin được trích ra từ frame tiếng nói nhận tốt trước đó Hai
thông số này được kết hợp để tạo ra xap xỉ cho gói bị mat
Khối này dùng dé tim cdc hệ số LP {a()}, mô phỏng hình dạng bộ
máy phát âm của một frame tiếng nói
Frame tiếng nói nhận tốt trước đó được đưa vào bộ phân tích LP bậc
10 để được tạo ra 10 hệ số dự đoán tuyến tính nhờ thuật toán Levinson- Durbin 10 hệ số này được dùng làm hệ số của bộ lọc dự đoán và bộ lọc
tong hop
Các mẫu thuộc frame trước đó được lọc bang bộ lọc dự đoán và chỉ còn lại tín hiệu dư thừa Tín hiệu này được dùng để dự đoán pItch trong frame tiếng nói và tạo tín hiệu kích thích cho frame bị mắt
Khối này thực hiện ước đoán pitch của frame nhận tốt trước đó từ tín hiệu dư thừa Thông tin pitch này được dùng để xây dựng tín hiệu kích
thích của frame bị mắt
Đối với frame unvoiced, tín hiệu dư thừa không có chu kỳ pitch
Trang 9Đối với frame voiced, vì tần số cơ bản của tiếng nói năm trong
khoảng 50Hz — 500Hz, chu kỳ pitch được xác định bằng cách tìm đỉnh
của dãy chuẩn hóa r,(n)/r,(0) trong khoảng thời gian tương ứng 3 đến
15ms trong frame tiếng nói 20ms theo công thức sau:
10
i=l Với 1,(i), r(n-i) lần lượt là chuỗi tự tương quan của các hệ số dự đoán
và của các mâu trong l frame
10
r,(n)=_ a,()a,(i+n) (3.4)
i=l
Chu ky pitch bang gid tri n=N,, voi r.(N,)/r-(O) 1a lon nhất
e - Bộ tạo tín hiệu kích thích
Tín hiệu dư thừa và chu kỳ pitch của frame nhận được trước đó được
dùng để tạo ra tín hiệu kích thích cho frame bị mất
Nếu frame nhận được trước đó là unvoiced thì tín hiệu kích thích của
frame bị mắt là nhiễu
Nếu frame nhận được trước đó là voiced thì tín hiệu kích thích của
frame bị mất được tạo ra bằng cách: lặp P (pitch) mẫu cuối cùng trong tín
hiệu dư thừa nhiều lần cho tới khi điền đầy số mẫu trong tín hiệu kích
thích
Hinh 3.7 Cach tao tin hiéu kich thich cua frame bi mat tir frame
trước đó
se - Bộ lọc tổng hợp
Tín hiệu tiếng nói của frame bị mất được tái tạo bằng cách cho tín hiệu kích thích khi đi qua bộ lọc tổng hợp để được thêm vào thông tin bộ
máy phát Các hệ số LP trong bộ phân tích LP được dùng làm hệ số
trong bộ lọc tổng hợp Bộ lọc tong hợp là bộ lọc toàn cực bậc 10
i=l
e Phuong phap bi mất gói dựa theo mô hình LP là phương pháp ngoại suy, nó chỉ dùng các frame được nhận trước đó, không dùng các frame sau vì như thế sẽ tăng thêm thời gian trễ, điều này không tốt cho các ứng dụng thời gian thực
3.1.2.3 Bù mất gói dùng dự đoán tuyến tính đệ quy Phương pháp này dùng dự đoán tuyến tính một cách đệ quy để ước lượng frame (gói) bị mất từ các mẫu (sample) tiếng nói thuộc các frame
kê cận nhận được
Forward LPC Adaptive Gai Forward LPC Sự Coefficients
Smoothing
GS, i
Hình 3.8 Sơ đồ khối thuật toán bù mắt gói dùng dự đoán tuyến tính
đệ quy
Bu mat gói đơn dùng cả dự đoán trước và dự đoán sau
Công thức dự đoán trước (forward prediction) một mẫu từ các mẫu nhận được trước đó:
Trang 1019
^
Với xz,„ là mâu được dự đoán thuộc frame bị mật, x„_, là các mâu
tiêng nói thuộc frame được nhận trước đó N là bậc dự đoán; z,là hệ sô
LPC duoc tinh từ M mẫu thuộc frame nhận được trước frame bị mât
(x„ , với 1= l1, 2, , M và M là chiêu dài của frame tiêng nói) Hệ sô n-i
LPC được tính băng công thức Levinson-Durbin
^
Các mâu sau đó, x;„„:; được dự đoán một cách đệ quy bởi các mau
“Aw
đã được dự đoán và các mâu nhận được trước đó Ví dụ, xz,„ và x;
^
với i=n-l, n-2, , n-N+1 được dùng để dự đoán mẫu x/„„¡
=e)
I
Hinh 3.9 So dé khéi thuật toán dự đoán các mẫu LPC
Trong quá trình dự đoán các mẫu của gói bị mắt, hệ số LPC của frame
bị mắt vẫn dùng nguyên lại hệ số LPC của frame nhận tốt trước đó Quá
trình dự đoán mẫu được lặp lại cho toàn bộ frame bị mat
j=l
Khi dự đoán, độ lợi của tiếng nói dự đoán bị giảm dần Vì vậy, cần có
một độ lợi tăng tuyến tính Z ; thêm vào G f bat dau bang 1 tai dau frame
bi mat va bang 1.8 tai cudi frame bi mắt Độ lợi được nhân vào các mẫu
tiếng nói dự đoán
Dự đoán sau (backward prediction) là dự đoán bằng cách dựa vào các
mẫu phía sau Công thức sau là dự đoán sau của một mẫu từ các mẫu
nhận được sau đó:
20
— _|*
i=1
A
Với Xpn là mâu được dự đoán sau thudc frame bi mat,
x n-it+t N +1 là các mâu tiêng nói thuộc frame nhận được sau đó;
b, là hệ số LPC được tính từ M mẫu thuộc frame nhận được sau frame bị
mất Hệ số LPC cũng được tính bằng công thức Levinson-Durbin Vì thực hiện dự đoán sau nên cần nhận được frame phía sau frame bị mat,
do vậy, thời gian trễ xử lý tăng lên Quá trình dự đoán mẫu được lặp lại
cho toàn bộ frame bị mất với trật tự thời Ø1an ngược
Độ lợi thích ứng Œ, được áp dụng theo cách tương tự G , bắt đầu bằng tại cuối frame bị mất và bằng 1.8 tại đầu frame bị mất Độ lợi được nhân vào các mẫu tiếng nói dự đoán `
Có hai ước đoán cho frame bị mất, đó là x;„.¡ và X»„+¡ Dự đoán
trước x ¢nti dự đoán phần đầu của frame bị mắt tốt hơn; x;„:; dự đoán tốt hơn phần sau của frame bị mất
Do vậy, cần kết hợp hai dự đoán với trọng số tuyến tinh dé dat duoc
dự đoán của một mẫu đơn giản:
Xn+i = 1 -Q@) xX pinsit ،.Xb nai (3/10)
Với œ là trọng số tăng tuyến tính, œ=0 tại đầu frame bị mất và bằng I
tại cuối frame bị mắt
Theo phương pháp dự đoán đệ quy, bù mắt gói đơn thực hiện nội suy
từ gói trước và gói sau của gói bị mất Nội suy gói bị mắt từ gói ở hai chiều cải thiện tốt hơn chất lượng tiếng nói, tuy nhiên, nó làm tăng độ trễ
xử lý vì phải đợi thêm gói thoại
3.2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ CHAT LUONG TIENG NOI
3.2.1 Phương pháp đánh giá chủ quan
3.2.1.1 Phương pháp đánh giá tuyệt đối ACR
Đánh giá chất lượng tiếng nói theo thang điểm MOS từ 1 -> 5