Nâng cao chất lượng thoại trên mạng IP bằng kỹ thuật bù mất gói

se Trễ xử lý gói Sau khi thực hiện xử lý số, hệ thống VoIP đặt vào bộ đệm các khung dữ liệu tiếng nói đã được mã hóa trước khi gói hóa để truyền đi.. Tuy nhiên, trong trường hợp thông t

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NĂNG

TRƯƠNG LÊ PHƯƠNG ANH

NANG CAO CHAT LƯỢNG THOẠI

TREN MANG IP BANG KY THUAT BU

MAT GOI

Chuyên ngành: Kỹ thuật điện tử

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng, năm 201 1

Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NANG

Người hướng dẫn khoa học: TS Phạm Văn Tuấn

Phản biện I: TS Ngô Văn Sỹ

Phản biện 2: TS Lương Hồng Khanh

Luận văn sẽ được bảo vệ trước Hội đồng cham Luan van tốt nghiệp Thạc sĩ ngành Kỹ thuật điện tử họp tại Đại học

Đà Nẵng vào ngày 26 tháng 06 năm 2011

Có thể tìm luận văn tại:

- _ Trung tâm Thông tin - Học liệu Đại học Đà Nẵng

- Trung tam Hoc liệu Dai học Da Nang

Trang 2

MO DAU

1 TINH CAP THIET CUA DE TAI

Ngày nay, khi xã hội phát triển, nhu cầu liên lạc của con người càng

trở nên bùng nố và cấp thiết, các yêu cầu về loại hình dịch vụ thông tin

ngày càng phong phú Tuy nhiên các dịch vụ này lại chiếm rất nhiều

băng thông đường truyền

Để sử dụng tài nguyên viễn thông một cách hiệu quả nhất, kỹ thuật

chuyển mạch gói đã ra đời Công nghệ này chia dữ liệu cần vận chuyển

thành các gói (hay các khung) có kích thước và định dạng xác định Mỗi

gói như vậy sẽ được vận chuyền riêng rẽ và đến nơi nhận bằng các đường

truyền khác nhau Khi toàn bộ các gói dữ liệu đã đến nơi nhận thì chúng

sẽ được hợp lại thành dữ liệu ban đầu

Tiết kiệm băng thông đường truyền và nâng cao chất lượng cuộc gọi

là điều quan trọng mà nhà cung cấp dịch vụ cần phải quan tâm Tuy

nhiên, khi truyền thoại trên mạng chuyển mạch gói, do thoại là dịch vụ

thời gian thực nên nó chỉ cho phép thời gian trễ và tỷ lệ mất gói thấp

Mất gói lớn xảy ra làm chất lượng cuộc gọi kém đi, gây khó chịu cho

khách hàng Vì vậy, việc nghiên cứu và áp dụng các biện pháp để nâng

cao chất lượng cuộc gọi trong mạng IP là điều rất cần thiết

2 MỤC ĐÍCH NGHIÊN CỨU

Đề tài tiến hành nghiên cứu tổng quan VolP; các yếu tố ảnh hưởng

chất lượng thoại, các nguyên nhân dẫn đến việc mất gói thoại; tìm hiểu

mô hình tạo tiếng nói, phân tích và áp dụng phương pháp bù mất gói

thoại để nâng cao được chất lượng dịch vụ

3 ĐÓI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

Đối tương nghiên cứu :

- _ Phương pháp xử lý tiếng nói

- _ Phương pháp bù mất gói đối với thoại trong mạng IP

4

Phạm vi nghiên cứu : Công nghệ VoIP và các tiêu chuẩn QoS liên quan

4 MỤC TIỂU NGHIÊN CỨU

Nghiên cứu để hiểu rõ các phương pháp bù mất gói

5 PHƯƠNG PHÁP NGHIÊN CUU

Về lý thuyết: Thu thập tài liệu để nghiên cứu các biện pháp bù mất gói để nâng cao chất lượng thoại

6 Ý NGHĨA KHOA HỌC VÀ THỰC TIẾN CỦA ĐÈ TÀI

- - Ứng dụng lý thuyết của kỹ thuật xử lý tín hiệu và các phương pháp

xử lý tiếng nói để nâng cao chất lượng truyền dẫn thoại

- Hỗ trợ hiểu biết cho bản thân với tư cách là một kỹ thuật viên vận hành hệ thống VoIP

7 KET CAU CUA LUAN VAN

Luận văn gỗm 4 chương:

CHƯƠNG 1 - TONG QUAN VoIP & CHAT LUONG TRUYEN

DAN THOAI TRONG MANG IP

1.1 GIOI THIEU VoIP

Céng nghé VoIP (Voice Over Internet Protocol) là công nghệ truyền thoại gói Nguyên tắc thoại trên IP bao gồm việc số hóa tiếng nói, tiếp

theo là nén tín hiệu số phù hợp, chia tín hiệu thành các gói dữ liệu, cuối

cùng là truyền các gói dữ liệu này trên mạng sử dụng công nghệ IP Đến

nơi nhận, các gói dữ liệu được tập hợp lại, tín hiệu dữ liệu nhận được giải

mã, sau đó được chuyển đổi thành tín hiệu tương tự để phục hồi âm thanh

1.2 LOLICH CUA VoIP 1.3 H.323 - TIEU CHUAN VAN CHUYEN TIENG NOI TREN

MANG IP 1.3.1 Khai niém H.323

1.3.2 Kiến trúc H.323

Trang 3

1.3.3 Các giao thức điều khiến, thiết lập cuộc gọi trong H.323

1.4 CHAT LUONG TRUYEN DAN THOAI TRONG MANG IP

Gateway là thiết bị trung gian giữa các mạng, thực hiện chức năng

“phiên dịch”, thực hiện xử lý DSP và gói hóa thoại Các gói thoại được

truyền linh hoạt trong mạng IP nhờ cơ chế hoạt động hiệu quả của các bộ

định tuyến (Router) Router nhận các gói thoại trên đường truyền, lần

lượt bóc tách các header và đọc địa chỉ IP mạng để xác định đường đi tối

ưu nhất tới đích

Vì được thực hiện nhiều quá trình xử lý tại Gateway (DSP, đóng

gói ) và phải qua nhiều Router trên đường truyền để đến đích nên thời

gian trễ của gói thoại lớn, điều này ảnh hưởng rất nhiều đến chất lượng

thoại Về bản chất, mang IP lai là mạng best-effort, nó không đảm bảo tin

cậy hoàn toàn, do vậy, mất gói luôn luôn có thê xảy ra

Để cung cấp thoại có chất lượng tốt nhất, ta cần quan tâm đến các

yếu tố ảnh hưởng chất lượng như: trễ, mất gói hay echo; từ đó đề ra các

phương thức giảm thiểu những ảnh hưởng này

1.4.1 Trễ

Trễ trong hệ thống VolP cơ bản từ hai nguồn: trễ do bản thân

Gateway gây ra và trễ do bản thân mạng dùng để kết nối hai Gateway

gây ra Vì trễ là tích lũy, do vậy, bất cứ thời gian trễ nào do các thành

phần của VolP gây ra sẽ trực tiếp ảnh hưởng đến tổng thời gian trễ toàn

hệ thống Trong VoIP, mục tiêu phấn đấu là thời gian trễ một hướng nhỏ

hơn 300 ms

Te! ele one 1s "5 SS

—— TT?acri gian tre ban than =——= —

Giao diện mạng

Hình 1.6 Hệ thông VolP điển hình

1.4.1.1 Tré do Gateway gay ra

Xử lý tín hiệu số Xử lý gói

PCM >| DSP coding [*7

Giao diện mạng

Bộ đệm và đóng Bộ đệm

201 Jitter

TCP/IP Ngăn xêp giao thức

4

Vv

Giao diện mạng Ethernet

|

- Hình 1.7 Quá trình xử ly cua Gateway t IP

se Tré giao dién mang

e Tré trong qua trinh xi Ly tín hiệu số

Xử lý tín hiệu số được thực hiện bằng phần cứng DSP chuyên dụng

hay kết hợp thuật toán phần mềm để thực hiện: nén/ giải nén tiếng nói,

phát hiện tone, phát hiện im lặng, tạo tone, tạo nhiễu dễ chịu và triệt echo trên từng khung tiếng nói Quá trình DSP thực hiện xử lý toàn bộ các

khung dữ liệu cùng một lúc

Thời gian trễ của quá trình xử lý số tùy thuộc vào kích thước khung (frame) đối với từng phương pháp mã hóa thoại

se Trễ xử lý gói Sau khi thực hiện xử lý số, hệ thống VoIP đặt vào bộ đệm các khung

dữ liệu tiếng nói đã được mã hóa trước khi gói hóa để truyền đi

Mỗi gói dữ liệu VoIP bắt đầu với 40 byte header của giao thức IP, UDP va RTP Header chira dia chi IP nguén/dich, s6 céng UDP, sé thir

Trang 4

7

tự gói và các thông tin cần thiết khác để truyền đữ liệu Sau header, có

một hay nhiều khung dữ liệu thoại mã hóa theo sau

Quyết định dồn nén nhiều khung dữ liệu vào một gói đơn là sự cần

nhắc quan trọng đối với mỗi hệ thống VoIP Nếu khung dữ liệu có kích

thước nhỏ hơn so với 40 byte header, thì cần đặt nhiều hơn một khung

thoại mã hóa vào mỗi gói IP để giảm lãng phí do header IP gây ra Tuy

nhiên, điều này gây thêm nhiều thời gian trễ do thêm thời gian của chu

kỳ khung khác

1.4.1.2 Trễ do mạng IP gây ra

1.4.2 Echo

1.4.3 Mat gói

Mang VoIP là mang không tin cậy về bản chất nên thường xảy ra

hiện tượng mắt gói Phần lớn nguyên nhân mắt gói có thể là:

- Mắt gói vì lỗi truyền dẫn Nếu checksum kiểm tra bị hỏng thì gói bị

loại bỏ

- Gói bị mất do nghẽn mạng (mạng quá tải) Nếu không đủ không

gian bộ đệm trong các Router, hàng đợi xảy ra hiện tượng tràn Một

Router thường có bộ đệm giao tiếp ở ngõ vào, bộ đệm hệ thống và bộ

đệm giao tiếp ở ngõ ra Mất gói ở ngõ vào thường xảy ra khi Router

không thể xử lý các gói đủ nhanh Mắt gói ở ngõ ra khi kết nối ở ngõ ra

quá bận

- Mất gói xảy ra do gói trải qua một thời gian trễ trên mạng quá lớn

và đến đích quá trễ

Đối với các ứng dụng không phải thời gian thực như truyền file hay

email , mất gói không quan trọng vì nó dùng cơ cấu phát lại Tuy nhiên,

trong trường hợp thông tin thoại thời gian thực, các gói đến phải nằm

trong cửa số thời gian thực tương đối hẹp để tái tạo tín hiệu tiếng nói Do

vay co cau phat lại thực sự không phù hợp

8

Sau đây là các kỹ thuật được sử dụng để hiệu chỉnh và khôi phục sự

mất gói Các kỹ thuật này sẽ được trình bày kỹ hơn trong chương 3 phía sau

se - Khôi phục các gói bị mất ở phía phát

- Media-independent FEC

- Media-dependent FEC: các gói thoại dự phòng được đi kèm với

các gói thoại khác để có thể thực hiện khôi phục gói bị mắt

- Một gói thoại được chia ra thành các unit nhỏ hơn và xếp xen kẻ

nhau trong các gói khác nhau

se - Khôi phục các gói bị mất ở phía thu

- Bên thu bù mắt gói bằng cách thay thế nhiễu nền vào vị trí các gói

bi mat hay lặp lại gói cuối cùng nhận được trong suốt khoảng thời gian khi gói bị mất

- Thực hiện ngoại suy hay nội suy gói bị mất từ các gói được nhận

trước hay gói nhận sau.| 12]

- Thực hiện tái tạo gói bị mất theo mô hình huấn luyện

Chương 1 đã trình bày một cách tổng quan về VoIP va cdc van dé cần quan tâm để nâng cao chất lượng tiếng nói trong mạng IP Tuy nhiên,

để có cơ sở thực hiện việc bù mất gói sẽ trình bày ở chương 3, ta cần hiểu thêm về cơ chế tạo tiếng nói và các kỹ thuật xử lý

Chương 2 sẽ trình bày mô hình tạo tiếng nói, các kỹ thuật trong xử lý tín hiệu tiếng nói và phương pháp mã hóa được img dung trong VoIP

CHƯƠNG 2 - KY THUAT XU LY TIENG NOI DUA TREN MA

HOA DU DOAN TUYEN TINH 2.1 QUA TRINH TAO TIENG NOI

> 2k EA ⁄⁄⁄⁄ 22224022277

Lirc tác động Ór các cơ-< = = 5 = : Se

phôi —— =—== ° —— ———- > Miéne

S 6, 1 _ — lưỡi ——

Trang 5

Hình 2.2 Mô hình cơ học của cơ quan phát âm người

2.2 MÔ HÌNH DỰ ĐOÁN TUYẾN TÍNH

Hình 2.6 Mô hình toán học của việc tạo tiếng nói

Từ nguyên lý tạo tiếng nói người như trên, một mô hình toán học

(mô hình mã hóa dự đoán tuyến tính) được dùng để mô phỏng việc tạo

tiếng nói:[13]

Môi quan hệ giữa mô hình vật lý và mô hình toán học:

Bộ máy phát âm <=> H(2) ( Bộ lọc LPC)

Sự rung của dây thanh âm <=> V (Voiced)

Chu kỳ rung của dây thanh âm <=> T (Chu ky pitch)

Phụ âm sát và phụ âm bật <=> UV (Unvoiced)

Độ lớn không khí <=> G (Độ lợi)

2.3 FRAMING, OVERLAP-ADDING TRONG XU LY TIN HIEU

TIENG NOI

window

⁄ oN “ “oN y(n)

afl ald poi ers fla, A, Í

N: kích thước của frame N

Hinh 2.7 Phan tich tin hiéu thanh frame

2.4 PHUONG PHAP PHAN TICH MA HOA DU DOAN TUYEN TINH

Tín hiệu tiếng nói thay đổi theo thời gian Ứng với một đoạn tiếng nói ngắn (gọi là segment hay frame), tiếng nói được xem là tín hiệu dừng Nói

cách khác, mô hình bộ máy phát âm là không đổi trên mỗi segment Thông

thường, mỗi segment có chiều dài 20ms, nếu tiếng nói được lẫy mẫu tại tan s6 8kHz thi s6 mau trong 1 segment 14 160 mau

Xét mot frame tiéng nói: Đối với mô hình dự đoán tuyến tính trên, bộ máy phát âm được xem như bộ lọc toàn cực với đầu vào bộ lọc là một chuỗi nhiễu trắng hay là một dãy xung tựa tuần hoàn; đầu ra bộ lọc là

tiếng nói số Bộ lọc này là bộ lọc đệ quy nhưng chỉ lấy đầu vào là mẫu

âm kích thích hiện tại u(n) để tính thay vì lẫy m mẫu quá khứ của u(n) Tiếng nói đầu ra được mô tả bằng công thức:

M

k=l

Voi a, 1a hé số dự đoán tuyến tính M: bậc dự đoán Gọi s (n) là mẫu hiện tại của tiếng nói được dự đoán tuyến tính từ M

mâu quá khứ của tiêng nói

k=l Như vậy, sai lệch e(n) giữa mẫu tiếng nói thực và mẫu dự đoán: e(n) = s(n) — s(n) = s(n) — Sa, s(n —k) (2.4)

Do vậy, tổng của sai lệch dự đoán bình phương của cả frame:

E=Yie?(n) = Vs(n)- Ya, sin-WY

Trang 6

II 12

2.4.1 Xác định các thông số bộ lọc và độ lợi

Đề xác định các hệ số bộ lọc dự đoán tuyến tính, ta phải tối thiểu hóa Hình 2.9 Thuật toán CELP

Hệ số bộ lọc a, (hệ số dự đoán tuyến tính) được giải bằng thuật toán

LP analysIs

2.4.2 Xác định Voiced/Unvoiced và xác định chu ky pitch s đebook

Quá trình mã hóa LPC sẽ tính toán và truyện đi các thông sô bộ lọc, Encoded bit stream of payload bytes

dâu hiệu xác định voiced/unvoiced và chu kỳ pitch của khung tiêng nói

đê mã hóa I khung là: 2400*0.02 = 48 bit

Divide into 4 subframes —_> xe

Adaptive Stochastic

.— LPC spectral Spectral codebook search codebook search 0110 Gain Gain l7 Decoded

- - analysis “| filtering ¬_ " —* parameters rd _| Synthesis samples

i Post Ly High-pass ›

codebook

, i Na Stochastic Speech <q“ Linear " excitation LSP

Trang 7

Hình 2.11 Bộ giải mã CELP

2.6 KÉT LUẬN CHƯƠNG

Chương này trình bày phương pháp phân tích tín hiệu tiếng nói Đây

là cơ sở thực hiện nâng cao chất lượng tiếng nói ở chương 3

CHƯƠNG 3 - CÁC PHƯƠNG PHÁP BÙ MÁT GÓI & ĐÁNH

GIA CHAT LUONG TIENG NOI 3.1 CAC KY THUAT PHUC HOI MAT GOI

Có hai kỹ thuật phục hồi mất gói: kỹ thuật phục hồi mất gói từ phía

phát và kỹ thuật bù mắt gói ở phía thu Hai phương pháp này đều cố gắng

phục hồi gói bị mắt để cho tiếng nói có chất lượng tốt nhất

3.1.1 Kỹ thuật phục hồi mắt gói từ phía phát

Kỹ thuật này có thể phân chia như theo hình dưới đây:[12]

Khôi phục mất gói ở phía phát

Ỷ

Redundacy Sửa lỗi FEC Xen kẻ gói Truyền lại

(Media dependent) (Media independent) gói

Hình 3.1 Phân loại kỹ thuật phục hôi mắt gói từ phía phát

3.1.1.1 Truyễn gói lại

3.1.1.2 Sửa lỗi phía trưóc (FEC-Forward Error Corection)

Network loss in FEC Block

MA

Seed

Hình 3.2 Cơ chế phục hồi FEC Voice packets >

| 1O,11,1Z | 11,122,153 | 12,13.14 | 13,14,15 | 14,15,16 | Redundancy=2

Redundancy=0

Redundancy=1

Additional delay—>

First | Second | taa6.16 | Redundancy=2

| 10,191.12 | 11.12.13 lost xxx lost xxx with lost packets

— _—

Recovered packets sequence b>

Hình 3.3 Ví dụ cơ chế phục hôi gói Redundancy 3.1.1.3 Kỹ thuật sắp xếp xen ké (Interleaving)

Dimmm

Original Stream

teh + = [6]

Interleaved Stream

Packet Loss

I:Is[sl [:I:IsI:] MM CT Dele

[> [io 0m:

Hinh 3.4 Vi du co ché sap xép xen ké

3.1.2 Kỹ thuật bù mắt gói từ phía thu

Kỹ thuật này tạo ra sự thay thế gói bị mất bởi gói tương tự nguyên

Reconstructed Stream

bản

3.1.2.1 Bù mất gói bằng kỹ thuật chèn (Insertion)

Trang 8

Cơ chê khôi phục mật gói này có các loại:

Voice packets ©

15

16 17

11 | 12 | 13 | 14 | 15 ' Lost Lost! 18 | 19 | 20

(a) — Các gói nhận được có chỉ thi mat oi |

11 | 12 | 13 14 |15INhiễu Nhiều! 18 | 19 | 20

(b) — Khôi phục bằng thay thế nhigunén

(c) Khôi phục băng lặp lại gói trước đó

Hình 3.5 Kỹ thuật phục hồi mắt gói từ phía thu theo cơ chế chèn

3.1.2.2 Bù mắt gói dựa vào mô hình LP

Kỹ thuật này dùng mô hình dự đoán tuyến tính LP (Linear

Prediction) của quá trình tạo tiếng nói

Past samples

x(n)

Vv

Prediction

filter

A

b>

yr

LP analysis

Pitch

»/ detector

yr

Pitch period P

y

^

e(n) Excitation e(n)

> generator >

Residual

signal

LP coefficients

a(i)

Synthesis filter

Reconstructed

sigh al

x(n)

|

Hình 3.6 Sơ đồ khối thuật toán bù mắt gói dựa vào mô hinh LP

Theo mô hình LP tín hiệu tiếng nói x(n) gồm hai thành phân:

- Thông số dự đoán chứa thông tin bộ máy phát âm

16

- Tín hiệu dư thừa (sai lệch) chứa thông tin về tín hiệu kích thích

Tiéng nói được tạo ra bang cách cho tín hiệu kích thích đi qua một bộ

loc tong hop (bộ máy phát âm) Phương pháp bù này được thực hiện hoàn toàn từ bên thu đối với tín

hiệu PCM Nguyên tắc cơ bản của thuật toán này là ước tính hệ so LP

{a()} và tín hiệu kích thích {e(n)} của gói (frame) tiếng nói bị mat dựa

vào thông tin được trích ra từ frame tiếng nói nhận tốt trước đó Hai

thông số này được kết hợp để tạo ra xap xỉ cho gói bị mat

Khối này dùng dé tim cdc hệ số LP {a()}, mô phỏng hình dạng bộ

máy phát âm của một frame tiếng nói

Frame tiếng nói nhận tốt trước đó được đưa vào bộ phân tích LP bậc

10 để được tạo ra 10 hệ số dự đoán tuyến tính nhờ thuật toán Levinson- Durbin 10 hệ số này được dùng làm hệ số của bộ lọc dự đoán và bộ lọc

tong hop

Các mẫu thuộc frame trước đó được lọc bang bộ lọc dự đoán và chỉ còn lại tín hiệu dư thừa Tín hiệu này được dùng để dự đoán pItch trong frame tiếng nói và tạo tín hiệu kích thích cho frame bị mắt

Khối này thực hiện ước đoán pitch của frame nhận tốt trước đó từ tín hiệu dư thừa Thông tin pitch này được dùng để xây dựng tín hiệu kích

thích của frame bị mắt

Đối với frame unvoiced, tín hiệu dư thừa không có chu kỳ pitch

Trang 9

Đối với frame voiced, vì tần số cơ bản của tiếng nói năm trong

khoảng 50Hz — 500Hz, chu kỳ pitch được xác định bằng cách tìm đỉnh

của dãy chuẩn hóa r,(n)/r,(0) trong khoảng thời gian tương ứng 3 đến

15ms trong frame tiếng nói 20ms theo công thức sau:

10

i=l Với 1,(i), r(n-i) lần lượt là chuỗi tự tương quan của các hệ số dự đoán

và của các mâu trong l frame

10

r,(n)=_ a,()a,(i+n) (3.4)

i=l

Chu ky pitch bang gid tri n=N,, voi r.(N,)/r-(O) 1a lon nhất

e - Bộ tạo tín hiệu kích thích

Tín hiệu dư thừa và chu kỳ pitch của frame nhận được trước đó được

dùng để tạo ra tín hiệu kích thích cho frame bị mất

Nếu frame nhận được trước đó là unvoiced thì tín hiệu kích thích của

frame bị mắt là nhiễu

Nếu frame nhận được trước đó là voiced thì tín hiệu kích thích của

frame bị mất được tạo ra bằng cách: lặp P (pitch) mẫu cuối cùng trong tín

hiệu dư thừa nhiều lần cho tới khi điền đầy số mẫu trong tín hiệu kích

thích

Hinh 3.7 Cach tao tin hiéu kich thich cua frame bi mat tir frame

trước đó

se - Bộ lọc tổng hợp

Tín hiệu tiếng nói của frame bị mất được tái tạo bằng cách cho tín hiệu kích thích khi đi qua bộ lọc tổng hợp để được thêm vào thông tin bộ

máy phát Các hệ số LP trong bộ phân tích LP được dùng làm hệ số

trong bộ lọc tổng hợp Bộ lọc tong hợp là bộ lọc toàn cực bậc 10

i=l

e Phuong phap bi mất gói dựa theo mô hình LP là phương pháp ngoại suy, nó chỉ dùng các frame được nhận trước đó, không dùng các frame sau vì như thế sẽ tăng thêm thời gian trễ, điều này không tốt cho các ứng dụng thời gian thực

3.1.2.3 Bù mất gói dùng dự đoán tuyến tính đệ quy Phương pháp này dùng dự đoán tuyến tính một cách đệ quy để ước lượng frame (gói) bị mất từ các mẫu (sample) tiếng nói thuộc các frame

kê cận nhận được

Forward LPC Adaptive Gai Forward LPC Sự Coefficients

Smoothing

GS, i

Hình 3.8 Sơ đồ khối thuật toán bù mắt gói dùng dự đoán tuyến tính

đệ quy

Bu mat gói đơn dùng cả dự đoán trước và dự đoán sau

Công thức dự đoán trước (forward prediction) một mẫu từ các mẫu nhận được trước đó:

Trang 10

19

^

Với xz,„ là mâu được dự đoán thuộc frame bị mật, x„_, là các mâu

tiêng nói thuộc frame được nhận trước đó N là bậc dự đoán; z,là hệ sô

LPC duoc tinh từ M mẫu thuộc frame nhận được trước frame bị mât

(x„ , với 1= l1, 2, , M và M là chiêu dài của frame tiêng nói) Hệ sô n-i

LPC được tính băng công thức Levinson-Durbin

^

Các mâu sau đó, x;„„:; được dự đoán một cách đệ quy bởi các mau

“Aw

đã được dự đoán và các mâu nhận được trước đó Ví dụ, xz,„ và x;

^

với i=n-l, n-2, , n-N+1 được dùng để dự đoán mẫu x/„„¡

=e)

I

Hinh 3.9 So dé khéi thuật toán dự đoán các mẫu LPC

Trong quá trình dự đoán các mẫu của gói bị mắt, hệ số LPC của frame

bị mắt vẫn dùng nguyên lại hệ số LPC của frame nhận tốt trước đó Quá

trình dự đoán mẫu được lặp lại cho toàn bộ frame bị mat

j=l

Khi dự đoán, độ lợi của tiếng nói dự đoán bị giảm dần Vì vậy, cần có

một độ lợi tăng tuyến tính Z ; thêm vào G f bat dau bang 1 tai dau frame

bi mat va bang 1.8 tai cudi frame bi mắt Độ lợi được nhân vào các mẫu

tiếng nói dự đoán

Dự đoán sau (backward prediction) là dự đoán bằng cách dựa vào các

mẫu phía sau Công thức sau là dự đoán sau của một mẫu từ các mẫu

nhận được sau đó:

20

— _|*

i=1

A

Với Xpn là mâu được dự đoán sau thudc frame bi mat,

x n-it+t N +1 là các mâu tiêng nói thuộc frame nhận được sau đó;

b, là hệ số LPC được tính từ M mẫu thuộc frame nhận được sau frame bị

mất Hệ số LPC cũng được tính bằng công thức Levinson-Durbin Vì thực hiện dự đoán sau nên cần nhận được frame phía sau frame bị mat,

do vậy, thời gian trễ xử lý tăng lên Quá trình dự đoán mẫu được lặp lại

cho toàn bộ frame bị mất với trật tự thời Ø1an ngược

Độ lợi thích ứng Œ, được áp dụng theo cách tương tự G , bắt đầu bằng tại cuối frame bị mất và bằng 1.8 tại đầu frame bị mất Độ lợi được nhân vào các mẫu tiếng nói dự đoán `

Có hai ước đoán cho frame bị mất, đó là x;„.¡ và X»„+¡ Dự đoán

trước x ¢nti dự đoán phần đầu của frame bị mắt tốt hơn; x;„:; dự đoán tốt hơn phần sau của frame bị mất

Do vậy, cần kết hợp hai dự đoán với trọng số tuyến tinh dé dat duoc

dự đoán của một mẫu đơn giản:

Xn+i = 1 -Q@) xX pinsit ØŒ.Xb nai (3/10)

Với œ là trọng số tăng tuyến tính, œ=0 tại đầu frame bị mất và bằng I

tại cuối frame bị mắt

Theo phương pháp dự đoán đệ quy, bù mắt gói đơn thực hiện nội suy

từ gói trước và gói sau của gói bị mất Nội suy gói bị mắt từ gói ở hai chiều cải thiện tốt hơn chất lượng tiếng nói, tuy nhiên, nó làm tăng độ trễ

xử lý vì phải đợi thêm gói thoại

3.2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ CHAT LUONG TIENG NOI

3.2.1 Phương pháp đánh giá chủ quan

3.2.1.1 Phương pháp đánh giá tuyệt đối ACR

Đánh giá chất lượng tiếng nói theo thang điểm MOS từ 1 -> 5

Định dạng
Số trang	14
Dung lượng	505,63 KB

Tiêu đề	Nâng cao chất lượng thoại trên mạng IP bằng kỹ thuật bù mất gói
Tác giả	Trương Lê Phương Anh
Người hướng dẫn	TS. Phạm Văn Tuấn
Trường học	Đại học Đà Nẵng
Chuyên ngành	Kỹ thuật điện tử
Thể loại	Luận văn
Năm xuất bản	2011
Thành phố	Đà Nẵng