1. Trang chủ
  2. » Giáo Dục - Đào Tạo

xu ly am thanh hinh anh nguyen thanh binh xlatha cuuduongthancong com

175 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xử lý âm thanh hình ảnh Nguyễn Thanh Bình
Tác giả Nhóm Biên Sơ N
Người hướng dẫn TS. Nguyễn Thanh Bình, ThS. Võ Nguy N Qu C B
Trường học Học Viện Công Nghệ Thông Tin Liên Quân (HCI) - https://fb.com/tailieudientucntt
Chuyên ngành Xử lý âm thanh và hình ảnh
Thể loại Tổng quan
Năm xuất bản 2007
Thành phố Hồ Chí Minh
Định dạng
Số trang 175
Dung lượng 3,71 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trang 2

H C VI N CÔNG NGH B U CHÍNH VI N THÔNG

X LÝ ÂM THANH, HÌNH NH

THS VÕ NGUY N QU C B O

Trang 3

L I NÓI U

Tài li u h ng d n h c t p môn "X lý âm thanh và hình nh" dành cho kh i đào t o t

xa chuyên ngành đi n t vi n thông Tài li u này s gi i thi u nh ng ki n th c c b n v x lý âm thanh và hình nh c bi t, tác gi chú tr ng t i v n đ x lý tín hi u ng d ng trong m ng vi n thông: đó là các ph ng pháp nén tín hi u, l u tr , các tiêu chu n nén tín hi u âm thanh và hình

nh Nh ng ki n th c đ c trình bày trong tài li u s giúp h c viên ti p c n nhanh v i các v n đ

th c ti n th ng g p trong m ng vi n thông

Vì kh i l ng ki n th c trong l nh v c x lý âm thanh c ng nh hình nh r t l n, và v i

qu th i gian quá eo h p dành cho biên so n, tài li u h ng d n này ch a thâu tóm đ c toàn b

ki n th c c n có v l nh v c x lý âm thanh và hình nh tìm hi u v m t s v n đ có trong

đ c ng môn h c đòi h i h c viên ph i nghiên c u thêm trong s sách tham kh o đ c tác gi đ

c p t i trong ph n cu i c a tài li u này

N i dung cu n sách đ c chia làm hai ch ng:

M i ý ki n đóng góp đ ngh g i v theo đ a ch email: binhntptit@yahoo.com

Tp H Chí Minh 19/05/2007

Nhóm biên so n

Trang 5

CH NG 1 K THU T X LÝ ÂM THANH

1.1 T NG QUAN V X LÝ ÂM THANH

1.1.1 Gi i thi u s l c v âm thanh & h th ng x lý âm thanh

1.1.1.1 c tính c a âm thanh t ng t [1]

M c đích c a l i nói là dùng đ truy n đ t thông tin Có r t nhi u cách mô t đ c đi m

c a vi c truy n đ t thông tin D a vào lý thuy t thông tin, l i nói có th đ c đ i di n b i thu t

ng là n i dung thông đi p, ho c là thông tin M t cách khác đ bi u th l i nói là tín hi u mang

n i dung thông đi p, nh là d ng sóng âm thanh

K thu t đ u tiên dùng trong vi c ghi âm s d ng các thông s v c , đi n c ng nh

tr ng có th làm nên nhi u cách th c ghi âm ng v i các lo i áp su t không khí khác nhau i n

áp đ n t m t microphone là tín hi u t ng t c a áp su t không khí (ho c đôi khi là v n t c) Dù

đ c phân tích b ng cách th c nào, thì các ph ng pháp khi so sánh v i nhau ph i dùng m t t l

th i gian

Trong khi các thi t b t ng t hi n đ i trông có v x lý âm thanh t t h n nh ng thi t b

c đi n, các tiêu chu n x lý thì h u nh không có gì thay đ i, m c dù công ngh có v x lý t t

h n Trong h th ng x lý âm thanh t ng t , thông tin đ c truy n đ t b ng thông s liên t c

bi n thiên vô h n

H th ng x lý âm thanh s lý t ng có nh ng tính n ng t ng t nh h th ng x lý âm thanh t ng t lý t ng: c hai ho t đ ng m t cách “trong su t” và t o l i d ng sóng ban đ u không l i Tuy nhiên, trong th gi i th c, các đi u ki n lý t ng r t hi m t n t i, cho nên hai lo i

h th ng x lý âm thanh ho t đ ng s khác nhau trong th c t Tín hi u s s truy n trong kho ng cách ng n h n tín hi u t ng t và v i chi phí th p h n Trong giáo trình này, t p trung đ c p

đ n h th ng s x lý âm thanh

Thông tin dùng đ truy n đ t c a âm tho i v b n ch t có tính r i r c [2], và nó có th

đ c bi u di n b i m t chu i ghép g m nhi u ph n t t m t t p h u h n các ký hi u (symbol) Các ký hi u t m i âm thanh có th đ c phân lo i thành các âm v (phoneme) M i ngôn ng có các t p âm v khác nhau, đ c đ c tr ng b i các con s có giá tr t 30 đ n 50 Ví d nh ti ng Anh đ c bi u di n b i m t t p kho ng 42 âm v

Tín hi u tho i đ c truy n v i t c đ nh th nào? i v i tín hi u âm tho i nguyên th y

ch a qua hi u ch nh thì t c đ truy n c l ng có th tính đ c b ng cách l u ý gi i h n v t lý

Trang 6

m t âm v đ c bi u di n b i m t s nh phân, nh v y m t mã g m 6 bit có th bi u di n đ c

t t c các âm v c a ti ng Anh V i t c đ truy n trung bình 10 âm v /giây, và không quan tâm

đ n v n đ luy n âm gi a các âm v k nhau, ta có th c l ng đ c t c đ truy n trunh bình

c a âm tho i kho ng 60bit/giây

Trong h th ng truy n âm tho i, tín hi u tho i đ c truy n l u tr và x lý theo nhi u cách th c khác nhau Tuy nhiên đ i v i m i lo i h th ng x lý âm thanh thì có hai đi u c n quan tâm chung là:

1 Vi c duy trì n i dung c a thông đi p trong tín hi u tho i

2 Vi c bi u di n tín hi u tho i ph i đ t đ c m c tiêu ti n l i cho vi c truy n tin ho c l u

tr , ho c d ng linh đ ng cho vi c hi u ch nh tín hi u tho i sao cho không làm gi m nghiêm tr ng n i dung c a thông đi p tho i

Vi c bi u di n tín hi u tho i ph i đ m b o vi c các n i dung thông tin có th đ c d dàng trích ra b i ng i nghe, ho c b i các thi t b phân tích m t cách t đ ng

1.1.1.2 Khái ni m tín hi u

Là đ i l ng v t lý bi n thiên theo th i gian, theo không gian, theo m t ho c nhi u bi n

đ c l p khác, ví d nh :

Ü Âm thanh, ti ng nói: dao đ ng sóng theo th i gian (t)

Ü Hình nh: c ng đ sáng theo không gian (x, y, z)

Tín hi u đa chi u: bi n thiên theo nhi u h n m t bi n đ c l p, ví d nh tín hi u hình nh, tín hi u tivi tr ng đen

Tín hi u liên t c theo th i gian: là tín hi u đ c đ nh ngh a t i m i đi m trong đo n th i gian [a,b], ký hi u x (t)

Trang 7

Hình 1.2 Tín hi u liên t c theo th i gian Tín hi u r i r c th i gian: là tín hi u ch đ c đ nh ngh a t i nh ng th i đi m r i r c khác nhau, ký hi u x (n)

Hình 1.3 Tín hi u r i r c theo th i gian Tín hi u liên t c giá tr : là tín hi u có th nh n tr b t k trong đo n [Ymin,Ymax], ví d tín

hi u t ng t (analog)

Hình 1.4 Tín hi u liên t c giá tr Tín hi u r i r c giá tr : tín hi u ch nh n tr trong m t t p tr r i r c đ nh tr c (tín hi u

s )

Trang 8

Hình 1.5 Tín hi u r i r c giá tr Tín hi u analog: là tín hi u liên t c v th i gian, liên t c v giá tr

Hình 1.6 Tín hi u analog Tín hi u s : là tín hi u r i r c v th i gian, r i r c v giá tr

Tín hi u ng u nhiên: giá tr c a tín hi u trong t ng lai không th bi t tr c đ c Các tín

hi u trong t nhiên th ng thu c nhóm này

Tín hi u t t đ nh: giá tr tín hi u quá kh , hi n t i và t ng l i đ u đ c xác đ nh rõ, thông th ng có công th c xác đ nh rõ ràng

1.1.1.4 Phân lo i h th ng x lý

G m hai lo i h th ng là h th ng t ng t và h th ng s Trong đó h th ng x lý s : là

h th ng có th l p trình đ c, d mô ph ng, c u hình, s n xu t hàng lo t v i đ chính xác cao, giá thành h , tín hi u s d l u tr , v n chuy n và sao l u, nh c đi m là khó th c hi n v i các tín hi u có t n s cao

Trang 9

1.1.1.5 H th ng s x lý âm thanh [3]

nh y c a tai ng i r t cao, nó có th phân bi t đ c s l ng nhi u r t nh c ng nh

ch p nh n t m biên đ âm thanh r t l n Các đ c tính c a m t tín hi u tai ng i nghe đ c có th

đ c đo đ c b ng các công c phù h p Thông th ng, tai ng i nh y nh t t m t n s 2kHz và

c a tai ng i đ c phân tích và ng i ta nh n đ c k t qu là có d ng đáp ng logarith

Tín hi u âm thanh đ c truy n qua h th ng s là chu i các bit B i vì bit có tính ch tt r i

r c, d dàng xác đ nh s l ng b ng cách đ m s l ng trong m t giây, d dàng quy t đ nh t c đ truy n bit c n thi t đ truy n tín hi u mà không làm m t thông tin

Hình 1.8 nh n đ c tám m c tín hi u khác nhau m t cách phân bi t, tín hi u đ

nh-đ nh c a tín hi u nhi u ph i nh h n ho c nh-đ sai bi t gi a các m c nh-đ T s tín hi u trên nhi u

ph i t i thi u là 8:1 ho c là 18dB, truy n b i 3 bit 16 m c thì t s tín hi u trên nhi u ph i là 24dB, truy n b i 4 bit

1.1.1.6 Mô hình hóa tín hi u âm thanh [4]

Có r t nhi u k thu t x lý tín hi u đ c mô hình hóa và áp d ng các gi i thu t trong vi c khôi ph c âm thanh Ch t l ng c a âm tho i ph thu c r t l n vào mô hình gi đ nh phù h p v i

d li u i v i tín hi u âm thanh, bao g m âm tho i, nh c và nhi u không mong mu n, mô hình

ph i t ng quát và không sai l nh so v i gi đ nh M t đi u c n l u ý là h u h t các tín hi u âm tho i là các tín hi u đ ng trong th c t , m c dù mô hình th c ti n thì th ng gi đ nh khi phân tích tín hi u là tín hi u có tính ch t t nh trong m t kho ng th i gian đang xét

Mô hình phù h p v i h u h t r t nhi u lãnh v c trong vi c x lý chu i th i gian, bao g m

vi c ph c h i âm thanh là mô hình Autoregressive (vi t t t AR), đ c dùng làm mô hình chu n cho vi c phân tích d đoán tuy n tính

Trang 10

1

(1.1)

Mô hình AR đ i di n cho các quá trình tuy n tính t nh, ch p nh n tín hi u t ng t nhi u

và tín hi u t ng t đi u hòa M t mô hình khác phù h p h n đ i v i nhi u tình hu ng phân tích

là mô hình auto regressive moving-average (ARMA) cho phép các đi m c c c ng nh đi m 0 Tuy nhiên mô hình AR có tính linh đ ng h n trong phân tích h n mô hình ARMA, ví d m t tín

hi u nh c ph c t p c n mô hình có b c P>100 đ bi u di n d ng sóng c a tín hi u, trong khi các tín hi u đ n gi n h n ch c n bi u di n b ng b c 30 Trong nhi u ng d ng, vi c l a ch n b c

c a mô hình phù h p cho bài toán sao cho đ m b o vi c bi u di n tín hi u là th a vi c không làm

m t đi thông tin c a tín hi u là vi c h i ph c t p Có r t nhi u ph ng pháp dùng đ c l ng

ph ng pháp robust to noise [Huber, 1981, Spath, 1991], v.v… Tuy nhiên, đ i v i vi c x lý các

tín hi u âm nh c ph c t p thì thông th ng s d ng mô hình Sin (Sinusoidal) r t có hi u qu trong các ng d ng âm tho i Mô hình Sin r t phù h p trong các ph ng pháp dùng đ gi m nhi u Tín hi u đ c cho b i công th c sau

P i

i n t dt a

n s n

0 1

̇ K đ n, s d ng m t microphone đ thu tín hi u âm thanh (trong không khí) và chuy n

đ i thành tín hi u đi n, t m đi n áp ngõ ra c a microphone ±1 volt nh Hình 1.10

Trang 11

Hình 1.10 D ng sóng c a tín hi u đi n

chuy n đ i t ng t -s (analog-to-digital converter) Khi s d ng b chuy n đ i 16bit

t ng t -s , t m s nguyên ngõ ra có giá tr –32,768 đ n +32,767, đ c mô t nh hình 1.11

Hình 1.11 Ngõ ra c a b chuy n đ i tín hi u t ng t sang tín hi u s

̇ Vì s l ng đi m d li u là vô h n nên không th l y t t c các đi m thu c tr c th i gian,

vi c l y m u s đ c th c hi n trong m t kho ng th i gian đ u đ n S l ng m u trong

m t giây đ c g i là t n s l y m u (sampling rate) Hình 1.12 mô t 43 m u đ c l y

Hình 1.12 Th c hi n vi c l y m u

̇ K t qu c a vi c l y m u là m t chu i g m 43 ch s bi u di n cho các v trí c a d ng sóng ng th i gian gian là m t chu k (hình 1.13)

Hình 1.13 K t qu c a vi c l y m u các giá tr

Trang 12

Máy tính sau đó s xây d ng l i d ng sóng c a tín hi u b ng vi c k t n i các đi m d li u

B Hình dáng c a tín hi u tái t o ph thu c vào s l ng m u đ c ghi nh n

T ng quát, m t dãy s h u h n (đ i di n cho tín hi u s ) ch có th bi u di n cho m t

d ng sóng tín hi u t ng t v i đ chính xác h u h n

1.1.1.8 T n s l y m u

Khi chuy n đ i m t âm thanh sang d ng s , đi u c n l u ý là t n s l y m u c a h th ng

x lý ph i đ m b o tính trung th c và chính xác khi c n ph c h i l i d ng sóng tín hi u ban đ u

Theo đ nh l y m u Nyquist và Shannon, t n s l y m u quy t đ nh t n s cao nh t c a tín

hi u ph c h i tái t o l i d ng sóng có t n s là F, c n ph i l y 2F m u trong m t giây T n

s này còn đ c g i là t n s Nyquist Tuy nhiên, đ nh lý Nyquist không ph i là t i u cho m i

tr ng h p N u m t d ng sóng hình Sin có t n s là 500Hz, thì t n s l y m u 1000Hz N u nh

t n s l y m u cao h n t n s Nyquist s gây ra tình tr ng “hi u ng là” nh h ng đ n biên đ

c a tín hi u và tín hi u b c ng nhi u, tuy nhiên lúc đó thì các thành ph n hài t n s th p l i có tín

2

1)(

Bi n đ i z c a x (n) đ c đ nh ngh a b i bi u th c (1.6a) X (z) còn đ c g i là dãy công su t vô h n theo bi n z−1 v i các giá tr c a x (n) chính là các h s c a dãy công su t

Mi n h i t ROC là {z X (z) <∞}, là nh ng giá tr c a z sao cho chu i h i t , hay nói cách khác

Trang 13

Ví d : Cho x(n)=δ(nn0) Theo công th c (1.3a), ta có X(z)= zn0

Ví d : Cho x(n)=u(n)−u(nN) Theo công th c (1.3a), ta có

1 1

1)

1()

z X

N N

n

n

az z

a z

b z

πj CX W z −1d

)/()(2

1

1.1.2.2 Phép bi n đ i Fourier

Bi n đ i Fourier c a tín hi u r i r c th i gian đ c cho b i bi u th c

jwn n

jw

e n x e

1)

Trang 14

= x n N n n

V i ~ n x( ) có th có d ng là t ng r i r c các tín hi u sin thay vì tích phân nh công th c

(1.9b) Phép bi n đ i Fourier cho chu i tu n hoàn nh sau

~)

(

~ N

n

kn N j

e n x k

~1)(

k

kn N j

e k X N k x

(

N n

n

z n x z

N u chia X (z) thành N đi m trên vòng tròn đ n v , j k N

k e

z = 2π , k=0,1, ,N −1, ta có:

)()

(

N n

kn N j k

N j

e n x e

X

π π

Trang 15

Ta nh n th y r ng các m u ( )

2

k N j

e X

π

t ph ng trình (1.9a) và (1.11) chính là các h s Fourier c a chu i tu n hoàn ~ n x( ) trong ph ng trình (1.12) Nh v y, m t chu i có chi u dài N

có th đ c bi u diwnx b i phép bi n đ i Fourier r i r c (DFT) nh sau:

(

N n

kn N j

e n x k

1)(

N k

kn N j

e k X N n x

n x rN n x n

x

))((

()(

)(

=

=+

x(( + 0))

)(

0

2

k X

)(

N m

N

m n h m

)(

1 N r

N

r k W r X N

1.2 MÔ HÌNH X LÝ ÂM THANH

1.2.1.1 L y m u tín hi u mi n th i gian và tái t o tín hi u liên t c [6]

x lý m t tín hi u liên t c b ng các ph ng ti n x lý tín hi u s , ta ph i đ i tín hi u liên t c đó ra d ng m t chu i s b ng các l y m u tín hi u liên t c m t cách tu n hoàn có chu k

T giây G i x (n) là tín hi u r i r c hình thành do quá trình l y m u, tín hi u liên t c x a (t), ta

)()(n x nT

Các m u x (n) ph i đ c l ng hóa thành m t t p các m c biên đ r i r c r i m i đ c

đ a vào b x lý s Hình 1.16 minh h a m t c u hình tiêu bi u cho h th ng x lý tín hi u t ng

Trang 16

t b ng ph ng pháp s Trong các ph n sau, ta b qua sai s l ng hóa phát sinh trong quá trình

nh lý l y m u: m t tín hi u liên t c có b ng t n h u h n, có t n s cao nh t là B Hertz

có th khôi ph c t các m u c a nó v i đi u ki n t n s l y m u F s ≥2B m u / giây

1.2.1.2 L y m u tín hi u mi n t n s và tái t o tín hi u liên t c

Ta đã bi t tín hi u liên t c có n ng l ng h u h n thì có ph liên t c Trong ph n này, ta

s xét quá trình l y m u c a các tín hi u lo i đó m t cách tu n hoàn và s tái t o ín hi u t các

e n x

Gi s ta l y m u X(ω) tu n hoàn t i các đi m cách nhau ∂ω rad Vì X(ω) tu n hoàn

v i chu k 2π , ch có các m u trong ph m vi t n s c b n là c n thi t thu n ti n, ta l y N

m u cách đ u nhau trong kho ng 0≤ω ≤2π theo kho ng cách ∂ω =2π /N

e n x k

N

1, ,1,

k

N

X N n

0

)

2(

1)( ∑− π π

Trang 17

T công th c x p (n) trên, ta nh n th y có th khôi ph c tín hi u x p (n) t các m u c a

ph X(ω) Nh v y, ta ph i tìm ra m i t ng quan gi a x p (n) và x (n) đ có th th c hi n khôi ph c x (n) t X(ω)

x p (n) là s m r ng tu n hoàn c a x (n), nên x (n) có th đ c khôi ph c t x p (n)

n u không có aliasing cõi th i gian, ngh a là n u x (n) có th i gian gi i h n nh h n ho c b ng chu k N c a x p (n)

1.2.1.4 Các chu n mã hóa âm tho i trong các h th ng x lý tho i [7]

chuyên gia đã giành h t th i gian và tâm huy t th c hi n các công vi c ki m nghi m, mô ph ng sao cho đ m b o m t t p các yêu c u đ a ra đáp ng đ c Ch có các t ch c v i ngu n tài nguyên kh ng l m i có th th c hi n đ c các công vi c khó kh n này, thông th ng, th i gian

t i thi u c n thi t đ hoàn thành m t chu n trong tr ng h p g p nhi u thu n l i trong quá trình

là kho ng b n n m r i

i u này không có ngh a là m t chu n đ c đ a ra thì “không có l i” ho c không c n

ph i c i ti n Do đó, các chu n m i luôn luôn xu t hi n sao cho t t h n chu n c c ng nh phù

h p v i các ng d ng trong t ng lai

H i đ ng chu n là các t ch c có trách nhi m trong vi c giám sát vi c phát tri n các chu n cho m t ng d ng c th nào đó Sau đây là m t s h i đ ng chu n n i ti ng đ c nhi u nhà cung c p s n ph m tuân theo

chu n vi n thông c a ITU (chu n ITU-T) có uy tín trong vi c đ nh ra các chu n mã hóa

âm tho i cho h th ng m ng đi n tho i, bao g m các m ng vô tuy n l n h u tuy n

Ü Hi p h i công nghi p vi n thông - Telecommunications Industry Association (TIA): có trách nhi m ban hành các chu n mã hóa tho i cho các ng d ng c th , là m t thành viên

c a Vi n tiêu chu n qu c gia Hoa K - National Standards Institute (ANSI) TIA đã thành công trong vi c phát tri n các chu n s d ng trong các h th ng t ng đài t bào s B c

M , bao g m các h th ng s d ng chu n đa k t phân th i gian - Time division multiple access (TDMA) và a truy nh p phân chia theo mã - Code division multiple access (CDMA)

Ü Vi n tiêu chu n vi n thông châu Âu - European Telecommunications Standards Institute (ETSI): ETSI có các h i viên t các n c c ng nh các công ty Châu Âu, là t ch c đ a

ra các chu n s n xu t thi t b t i Châu Âu ETSI đ c thành l p b i nhóm có nh h ng

nh t trong lãnh v c mã hóa âm tho i là nhóm di đ ng đ c bi t - Groupe Speciale Mobile (GSM), đã đ a ra r t nhi u chu n h u d ng và đ c tri n khai r t nhi u trên th gi i

Ü B qu c phòng Hoa K - United States Department of Defense (DoD) DoD có liên quan

đ n vi c sáng l p các chu n mã hóa tho i, đ c bi t đ n v i các chu n liên bang Hoa K (U.S Federal) dùng nhi u cho các ng d ng quân s

Ü Trung tâm phát tri n và nghiên c u các h th ng vô tuy n c a Nh t B n - Research and Development Center for Radio Systems of Japan (RCR) Các chu n t bào s đ c phát hành b i RCR

Trang 18

B ng 2.3 Các chu n mã hóa âm tho i chính

B c M

B c M

7.40, 6.70, 5.90, 5.15, 4.75

là đ c mô t ng n g n mà không có mô t k thu t chi ti t

1.2.1.5 Ki n trúc c a h th ng mã hóa âm tho i [8]

Hình 1.17 mô t s đ kh i c a h th ng mã hóa âm tho i Tín hi u âm tho i t ng t liên

t c có t ngu n cho tr c s đ c s hóa b i b m t b l c chu n, b l y m u (b chuy n đ i

th i gian r i r c), và b chuy n tín hi u t ng t sang tín hi u s Tín hi u ngõ ra là tín hi u âm tho i th i gian r i r c v i các giá tr l y m u c ng r i r c hóa Tín hi u này đ c xem là tín hi u

âm tho i s

Trang 19

Hình 1.17 S đ kh i c a h th ng x lý tín hi u tho i

Thông th ng, h u h t các h th ng mã hóa âm tho i đ c thi t k đ h tr các ng d ng

vi n thông, v i t n s gi i h n gi a 300 và 3400Hz Theo lý thuy t Nyquist, t n s l y m u t i thi u ph i l n h n hai l n b ng thông c a tín hi u liên t c th i gian Giá tr 8kHz th ng đ c l a

ch n là t n s l y m u chu n cho tín hi u tho i B mã hóa kênh th c hi n vi c mã hóa hi u ch nh

l i c a chu i bit truy n tr c khi tín hi u đ c truy n trên kênh truy n, n i mà tín hi u s b thay

đ i do nhi u c ng nh giao thoa tín hi u… B gi i mã th c hi n vi c hi u ch nh l i đ có đ c tín hi u đã mã hóa, sau đó tín hi u đ c đ a vào b gi i mã đ có đ c tín hi u âm tho i s có cùng t c đ v i tín hi u ban đ u Lúc này, tín hi u s s đ c chuy n sang d ng t ng t th i gian liên t c B ph n th c hi n vi c x lý tín hi u tho i ch y u c a mô hình h th ng x lý tho i

là b mã hóa và gi i mã Thông th ng, khi x lý các bài toán v truy n tho i, mô hình đ c đ n

gi n hóa nh Hình 1.18

Ví d tín hi u tho i ngõ vào là tín hi u r i r c th i gian có t c đ bit là 128kbps đ c đ a vào b mã hóa đ th c hi n mã hóa chu i bit ho c th c hi n nén d li u tho i T c đ c a chu i bit thông th ng s có t c đ th p h n t c đ c a tín hi u ngõ vào b mã hóa B gi i mã nh n chu i bit mã hóa này và t o ra tín hi u tho i có d ng là r i r c th i gian và có t c đ b ng v i t c

đ c a tín hi u ban đ u truy n vào h th ng

Hình 1.18 S đ kh i đ n gi n hóa c a b mã hóa âm tho i

Trang 20

1.2.1.6 Ki n trúc t ng quát c a b mã hóa – gi i mã âm tho i [9]

Hình 1.19 Mô t s đ kh i t ng quát c a b mã hóa và gi i mã âm tho i

i v i b mã hóa, tín hi u âm tho i đ u vào đ c x lý và phân tích nh m thu đ c các thông s đ i di n cho m t khung truy n Các thông s ngày đ c mã hóa và l ng t v i mã ch

s nh phân và đ c g i đi nh là m t chu i bit đã đ c nén Các ch s này đ c đóng gói và

bi u di n thành chu i bit, chúng đ c s p x p th t truy n d a vào các thông s đã quy t đ nh

tr c và đ c truy n đ n b gi i mã

Hình 1.20 Mô hình chung c a b mã hóa âm tho i Hình trên: b mã hóa, hình d i: b

gi i mã

B gi i mã th c hi n vi c phân tích chu i bit nh n đ c, các ch s nh phân đ c ph c

h i sau quá trình phân tích và dùng đ k t h p v i các thông s t ng ng c a b gi i mã đ có

Trang 21

đ c các thông s đã đ c l ng t Các thông s gi i mã này s k t h p v i nhau và đ c x lý

đ t o l i tín hi u âm tho i t ng h p

1.2.1.7 Các yêu c u c n có c a m t b mã hóa âm tho i [10]

M c tiêu chính c a c a mã hóa thoi là t i đa hóa ch t l ng nghe t i m t t c đ bit nào

đó, ho c t i thi u hóa t c đ bit ng v i m t ch t l ng đ c thù T c đ bit t ng ng v i âm tho i nào s đ c truy n ho c l u tr ph thu c vào chi phí c a vi c truy n hay l u tr , chi phí

c a mã hóa tín hi u tho i s , và các yêu c u v ch t l ng c a âm tho i đó Trong h u h t các b

mã hóa âm tho i, tín hi u đ c xây d ng l i s khác v i tín hi u nguyên th y T c đ bit truy n b

gi m b i vi c bi u di n tín hi u âm tho i (ho c các thông s trong mô hình t o âm tho i) v i đ chính xác b gi m, và b i quá trình lo i b các thông tin d th a c a tín hi u Các yêu c u lý

t ng c a m t b mã hóa tho i bao g m:

Ü T c đ bit th p: đ i v i chu i bit mã hóa có t c bit t l thu n v i b ng thông c n cho truy n d li u i u này d n đ n n u t c đ bit th p s làm t ng hi u su t c a h th ng Yêu c u này l i xung đ t v i các các đ c tính t t khác c a h th ng, nh là ch t l ng c a

âm tho i Trong th c t , vi c đánh đ i gi a các l a ch n ph thu c vào áp d ng vào ng

d ng gì

Ü Ch t l ng tho i cao: tín hi u âm tho i đã gi i mã ph i có ch t l ng có th ch p nh n

đ c đ i v i ng d ng c n đ t Có r t nhi u khía c nh v m t ch t l ng bao g m tính d

hi u, t nhiên, d nghe và c ng nh có th nh n d ng ng i nói

Ü Nh n d ng ti ng nói / ngôn ng khác nhau: k thu t nh n d ng ti ng nói có th phân bi t

đ c gi ng nói c a ng i l n nam gi i, ng i l n n gi i và tr con c ng nh nh n d ng

đ c ngôn ng nói c a ng i nói

Ü C ng đ m nh trong kênh truy n nhi u: đây là y u t quan tr ng đ i v i các h th ng truy n thông s v i các nhi u nh h ng m nh đ n ch t l ng c a tính hi u tho i

Ü Hi u su t cao đ i v i các tín hi u phi tho i (ví d nh tín hi u tone đi n tho i): trong h

th ng truy n d n kinh đi n, các tín hi u khác có th t n t i song song v i tín hi u âm tho i Các tín hi u tone nh là đa t n tone đôi – Dual tone multifrequency(DTMF) c a tín

hi u âm bàn phím và nh c thông th ng b chèn vào trong đ ng truy n tín hi u Ngay c

nh ng b mã hóa tho i t c đ th p c ng có th không th t o l i tín hi u m t cách hoàn

ch nh

Ü Kích th c b nh th p và đ ph c t p tính toán th p: nh m m c đích s d ng đ c b

mã hóa âm tho i trong th c t , chi phí th c hi n liên quan đ n vi c tri n khai h th ng

ph i th p, bao g m c vi c b nh càn thi t đ h tr khi h th ng ho t đ ng c ng nh các yêu c u tính toán Các nhà nghiên c u mã hóa âm tho i đã n l c trong vi c tìm ki m hi n

th c bài toán tri n khai trong th c ti n sao cho có hi u qu nh t

Ü tr mã hóa th p: trong quá trình x lý mã hóa và gi i mã tho i, đ tr tín hi u luôn luôn t n t i, chính là th i gian tr t gi a âm tho i ngõ vào c a b mã hóa v i tín hi u ngõ

ra c a b gi i mã Vi c tr quá m c s sinh ra nhi u v n đ trong vi c th c hi n trao đ i

ti ng nói hai chi u trong th i gian th c

1.2.2 Các mô hình dùng trong x lý âm thanh [11]

1.2.2.1 Mô hình quang ph

1.2.2.1.1 Mô hình sin

Trang 22

Tín hi u âm thanh có th đ c tri n khai t t p h p các mô hình sin n u nh có có d ng

i e t A t

y

1

)

)()

y

1

cos)()

0

i nT

i

i n ω τ dτ φ

V c b n, n u nh I có giá tr vô cùng l n, thì b t c tín hi u âm thanh nào c ng có th

đ c tri n khai t mô hình sin, phép tính g n đúng đ c áp d ng tính toán trong mô hình này

Th c t , tính hi u nhi u c ng đ c tri n khai thành vô s các tín hi u sin, và ta tách vi c x lý

riêng tín hi u này thành ph n x lý Stochastic (Λ) đ c ký hi u là e (n)

( ) ( )+

i( )cosφ

)(

hình 1 Ph ng pháp này đ c ng d ng trong các ph n m m sms, vi t t t c a t ng h p mô hình

ph - spectral modeling synthesis

Hình 1.21 Phân tích các thành ph n hình sin c a ph n stochastic

Trang 23

Phát hi n đ nh và ghép (Peak detection and continuation): đ th c hi n vi c phân tích

các thành ph n hình sin t tín hi u th ng d , ta ph i tìm đ c và ghi chú l i các đ nh t n s n i

tr i, t c là các thành ph n hình sin n m vai trò chính trong công th c phân tích đ c M t chi n thu t đ c s d ng đ th c hi n đi u này là v “b ng ch d n” trong các khung STFT

th c hi n vi c phân chia ph n nào là tín hi u, ph n nào là nhi u, các t n s và pha ph i

đ c xác đ nh m t cách chính xác Ngoài ra, đ quá trình t ng h p l i hai tín hi u đó đ c đ n

gi n, biên đ c a các thành ph n nên đ c n i suy gi a các khung tín hi u, và phép n i suy tuy n tính th ng đ c s d ng Các t n s c ng nh pha c a tín hi u c ng có th đ c n i suy, tuy nhiên c n ph i l u ý là phép n i suy t n s có nh h ng ch t ch đ n phép n i suy pha

T ng h p l i các thành ph n sin: Trong giai đo n t ng h p l i, các thành ph n sin có th

đ c t o b i b t k ph ng pháp nào nh máy t o dao đ ng s , máy t o dao đ ng b ng sóng ho c

t ng h p l y m u b ng sóng, ho c k thu t d a trên c s FFT K thu t FFT đ c s d ng nhi u

do tính ti n l i khi tín hi u có nhi u thành ph n hình sin

Trích tín hi u th ng d (Extraction of the residual): Vi c trích ph c a tín hi u nhi u

th ng d có th đ c th c hi n mi n t n (đ c mô t trong hình 1) ho c tr c ti p t mi n th i gian

S hi u ch nh ph th ng d (Residual spectral fitting): thành ph n stochastic đ c mô hình hóa là tín hi u nhi u b ng r ng, đ c l c b i kh i đ c tr ng tuy n tính Ph c ng đ c a tín

hi u th ng d có th đ c x p x b ng giá tr trung bình c a hàm piecewise-linear Vi c t ng h p trong mi n th i gian có th đ c th c hi n b ng phép đ o FFT, sau khi đã n đ nh đ c m t t p

c ng đ mong mu n và m t t p pha ng u nhiên

Hi u ch nh âm thanh: mô hình sin là m t mô hình h u d ng vì nó cho phép áp d ng vi c

truy n các âm thanh nh c l y t vi c ghi b ng th c t Hình 1.22 mô t m t các b c th c h ên cho vi c hi u ch nh tín hi u âm nh c

Hình 1.22 C c u t ch c cho vi c bi u di n vi c truy n tín hi u âm nh c

1.2.2.1.2 Tín hi u sin + nhi u + n t đ m

Trong mô hình sin + nhi u, đi u c b n là các tín hi u âm thanh là t ng h p c a nhi u tín

hi u sin t n s th p và các lo i nhi u b ng r ng h u nh d ng t nh Khi đó, m t thành ph n c a

âm thanh không đ c xem xét đ n, đó là n t đ m Vi c hi u ch nh âm thanh có th đ c th c

Trang 24

hi n d dàng b ng cách tách riêng thành ph n n t đ m đ xét riêng Th c t , h u h t các d ng c

âm nh c m r ng tr ng đ c a m t n t nh c không làm nh h ng đ n ch t l ng x lý

V i lý do này, m t mô hình m i là sin + nhi u + n t đ m đ c phát h a dùng trong vi c phân tích âm thanh Ý t ng chính c a vi c trích âm đ m trong th c t t vi c quan sát r ng, các tín hi u hình sin trong mi n th i gian đ c ánh x qua mi n t n thành các đ nh có v trí xác đ nh, trong khi đó các xung ng n đ i ng u trong mi n th i gian khi đ c ánh x qua mi n t n l i có

d ng hình sin Nh v y, mô hình sin có th đ c ng d ng trong mi n t n s bi u di n các tín

hi u hình sin S đ c a vi c phân tích SNT đ c mô t trong Hình 1.23

Hình 1.23 Phân tích tín hi u âm thanh theo mô hình sin + nhi u + n t đ m

Kh i DCT trong Hình 1.23 mô t ho t đ ng c a phép r i r c cosin

(

N

k n n

x k

(1.24)

Phép bi n đ i DCT th c hi n vi c m t xung đ c bi n đ i thành d ng cosin và ng c l i

1.2.2.1.3 Mô hình LPC

Mã hóa d đoán tuy n tính có th đ c s d ng đ mô hình ph t nh T ng h p LPC đ c

mô t trong l u đ trong Hình 1.24 V b n ch t, mô hình chính là gi i thu t tr t ng h p th c

hi n m t tính hi u có ph “đ c” đ c l c b i m t b l c c c Tín hi u kích thích có th s d ng chính tín hi u th ng d e có đ c qua quá trình phân tích, ho c có th d d ng các thông tin c a tín hi u tho i/phi tho i

1.2.2.2 Mô hình mi n th i gian

Vi c mô t âm thanh trong mi n t n r t có hi u qu , tuy nhiên trong m t vài ng d ng, đ

ti n vi c nghiên c u vi c t ng h p âm thanh, vi c phân tích trong mi n th i gian l i có u th h n

Trang 25

1.2.2.2.1 Máy t o dao đ ng s

Ta nh n th y m t âm thanh ph c t p đu c t ng h p t nhi u thành ph n hình sin b ng

phép t ng h p FTT-1 N u nh các thành ph n hình sin không quá nhi u, vi c t ng h p t ng thành

ph n đ c th c hi n b ng cách l y giá tr trung bình c a máy t o dao đ ng s

n j j n

j

e e

)(cos)(sin)1(n 0x n 0x n

áp ng xung c a b l c nh sau

0 1

1

1cos

21

1)

= − − −j z j z

R

e e

z z z

Giá tr c c c a b l c bi u th c 10 n m trên chu vi đ ng tròn đ n v

G i x R1, x R2 là hai bi n tr ng thái c a hai m u tr oc đó c a tín hi u ngõ ra x R, pha ban

Máy t o dao đ ng s đ c bi t h u ích trong vi c bi u di n t ng h p tín hi u đ i v i các b

vi x lý đa m c đích, khi các phép toán trên d u ch m đ ng đ c tri n khai Tuy nhiên, ph ng

pháp này dùng cho vi c t o tín hi u sin có hai b t l i:

̇ Vi c c p nh t thông s yêu c u tính toán trên hàm cosin ây là m t đi u khó đ i v i

đi u ch t c đ âm thanh, do ph i th c hi n phép tính cosin ng v i t ng m u trong

mi n th i gian

̇ Thay đ i t n s c a máy dao đ ng s s làm thay đ i biên đ tín hi u sin Khi đó b

ph n logic đi u khi n biên đ c n đ c s d ng đ đi u ch nh h n ch này

1.2.2.2.2 Máy t o dao đ ng b ng sóng

Trong ph ng pháp kinh đi n và linh đ ng nh t v t ng h p các d ng sóng có chu k (bao

g m tín hi u d ng sin) là vi c đ c l p đi l p l i m t b ng ch a n i dung c a m t d ng sóng đã

đ c l u tr tr c N u d ng sóng đ c t ng h p d ng sin, đ i x ng thì vi c l u tr cho phép

ch c n l u tr ¼ chu k , và vi c tính toán s h c s đ c n i suy cho c chu k

t buf[ ] là b đ m có n i dung ch a là chu k c a d ng sóng, ho c b ng d ng sóng

Máy t o dao đ ng d ng sóng ho t đ ng l p l i theo chu k quét b ng d ng sóng là b i s c a gia

s I và đ c n i dung c a b ng d ng sóng t i v trí đó

Trang 26

G i B là chi u dài c a b đ m, f0 là t n s mà ta mu n t o t n s l y m u F s, khi đó giá

F

s

s =

1 ,

2 ,

Hình 1.26 Ví d v thay đ i t n s l y m u v i L/M =3/2

1.2.2.2.3 T ng h p l y m u b ng sóng

T ng h p l y m u b ng sóng là ph n m r ng c a máy dao đ ng b ng sóng đ i v i

Trang 27

• D ng sóng phân tích không ph i d ng sin

• B ng d ng sóng đ c l u tr v i nhi u chu k

Các tín hi u đi u khi n r t quan tr ng trong vi c nh n đ c âm thanh t nhiên

1.2.2.2.4 T ng h p h t (v i Giovanni De Poli)

Các b ng sóng ng n có th đ c đ c v i nhi u t c đ khác nhau, và k t qu là âm đi u có

th ch ng chéo vào nhau trong mi n th i gian Trong ph ng pháp mi n th i gian, vi c t ng h p

âm thanh này đ c g i là t ng h p h t T ng h p h t b t đ u t ý t ng vi c phân tích âm thanh

trong mi n th i gian đ c thay th b ng bi u di n chúng thành m t chu i các thành ph n ng n

đ c g i là “h t” Các thông s c a k thu t này là các d ng sóng c a h t th g k(⋅), v trí trong

g n a g n l

Khi s l ng “h t” l n, thì vi c tính toán s tr nên ph c t p Tính ch t c a các h t và các

v trí trong mi n th i gian quy t đ nh âm s c c a âm thanh Vi c l a ch n các thông s tùy thu c

vào các tiêu chu n đ a ra b i các mô hình th hi n Vi c l a ch n các mô hình bi u di n liên quan

đ n các quá trình ho t đ ng mà các quá trình này có th nh h ng đ n âm thanh nào đó theo

K thu t t ng h p phi tuy n thông d ng nh t là đi u t n (FM) Trong liên l c thông tin,

FM đ c dùng trong các th p k g n đây, nh ng ng d ng c a nó trong gi i thu t t ng h p âm

thanh trong mi n th i gian r i r c đ c bi t đ n v i cái tên John Chowning V b n ch t,

Chowning đã th c hi n các nghiên c u trên các ph m vi khác nhau c a vi c t o ti ng rung b ng

các b t o dao đ ng đ n gi n, và thu đ c k t qu là các t n s rung nhanh s t o ra các thay đ i

đ y k ch tính Nh v y, đi u ch t n s c a m t máy t o dao đ ng c ng đ t o ra tín hi u âm

thanh có ph ph c t p Mô hình FM c a Chowning nh sau:

( n I n ) A ( n ( )n )

A n

V i ωc là t n s sóng mang và ωm là t n s đi u ch , I là ch s đi u ch Ph ng trình

Hình 1.27 mô t vi c tri n khai pd c a gi i thu t FM đ n gi n T n s đi u ch đ c

dùng đ đi u khi n tr c ti p b t o dao đ ng, trong khi t n s sóng mang dùng đ đi u khi n b

Trang 28

t o pha đ n v , t o pha theo chu k V i t n s sóng mang, t n s đi u ch và ch s đi u ch cho

tr c, ta có th d dàng d đoán các thành ph n ph t n s c a âm thanh k t qu

Hình 1.27 Ph n tri n khai phân ph i pd c a đi u pha

Vi c phân tích d a trên đ c tính l ng giác

k

m c k

m c k

carrier c

m c

n k n

k I

J n

I

J

A

n I

n A

)

(

ω ω ω

ω ω

ω ω

(1.38)

V i J k (I) là b c th k c a hàm Bessel Các hàm Bessel đ c v trên hình 9 ng v i nhi u giá tr k trên tr c s l ng side-frequencies và giá tr I trên tr c ch s đi u ch

Hình 1.28 Các giá tr c a hàm Bessel

Trang 29

B ng thông có giá tr x p x b ng

1.2.2.3.2 Méo phi tuy n

Khái ni m t ng h p âm thanh b ng méo phi tuy n – Nonlinear distortion (NLD) r t đ n

gi n: ngõ ra c a m ch t o dao đ ng đ c dùng nh là thông s c a m t hàm phi tuy n Trong

mi n th i gian r i r c s , hàm phi tuy n đ c l u tr trong m t b ng, và ngõ ra c a b dao đ ng

đ c dùng nh là ch s đ truy nh p vào b ng i u thú v c a NLD là lý thuy t này cho phép

thi t k m t b ng méo cho b i các đ c đi m k thu t c a m t ph mong mu n

N u b t o dao đ ng có d ng tín hi u sin, ta có th tính toán NLD nh sau

)cos(

)(n A 0n

( ) (x n )

F n

V i hàm s phi tuy n, dùng đa th c Chebyshev a th c Chebyshev c p đ n đ c đ nh

ngh a đ quy nh sau:

1)(

0 x =

x x

)()

(2)(x xT 1 x T 2 x

Nh v y, v i tính ch t (31), n u hàm méo phi tuy n là đa th c Chebyshev c p đ m, giá

tr ngõ ra y có đ c b ng cách s d ng b dao đ ng sin x(n)=cosω0n, nh v y

k T x h x

Ngoài các mô hình trên, các mô hình v t lý c ng đ c áp d ng trong vi c t ng h p, x lý

âm thanh nh m ch dao đ ng v t lý, m ch dao đ ng đôi và m ch phân ph i c ng h ng m t

chi u

1.2.3 Mô hình th i gian r i r c [12]

Trong h u h t các tr ng h p liên quan đ n x lý thông tin, vi c bi u di n tín hi u sao

cho đ m b o tính ti n l i trong phân tích mà v n không làm m t đi tính ch t c a tín hi u là đi u

mà các nhà khoa h c quan tâm Sóng âm thanh xu t phát t l i nói c a ng i có tính ch t t nhiên

và ng u nhiên nh t Phân tích toán h c thu n ti n nh t là xem sóng âm thanh là m t hàm s theo

bi n th i gian t Ta ký hi u x a (t) là d ng sóng t ng t theo th i gian t

Trang 30

Hình 1.29 Bi u di n tín hi u âm tho i

Trong giáo trình này, ta dùng ký hi u x (n) mô t cho chu i s Trong tr ng h p l y

m u tín hi u âm tho i, m t chu i có th đ c xem nh là m t dãy các m u c a tín hi u t ng t

đ c l y m u m t cách đ u đ n v i th i gian l y m u là T, khi đó tín hi u sau khi l y m u đ c

ký hi u b i x a (nT) Hình 1.1 mô t m t ví d c a vi c tín hi u âm tho i đ c bi u di n c hai

d ng là tín hi u t ng t và d ng chu i các m u đ c l y m u t n s là 8kHz

Xung đ n v đ c đ nh ngh a nh sau:

1)(n =

δ n=0

Chu i b c đ n v đ c ký hi u

1)(n =

)(n r e 0 r 0n j 0n

Trang 31

Hình 1.30 (a) L y m u đ n v , (b) đ n v b c, (c) hàm m th c và (d) hàm sin suy gi m

Hình 1.31 S đ kh i (a) h th ng đ n ngõ vào/đ n ngõ ra; (b) h th ng đ n ngõ vào/đa ngõ ra

Khi h th ng g m nhi u ngõ ra, tín hi u chu i ngõ ra s đ c bi u di n b ng m t vector

đ c mô t nh Hình 1.31

H th ng tuy n tính d ch b t bi n là h th ng đ c bi t h u d ng cho vi c x lý tín hi u âm tho i H th ng đ c đ c tr ng b i đáp ng xung, h (n), khi đó tín hi u ngõ ra đ c tính b i công th c

Trang 32

v i * là phép ch p hai tín hi u

1.3 LÝ THUY T VÀ CÁC BÀI TOÁN C B N

1.3.1 Phân tích d đoán tuy n tính [12]

D đoán tuy n tính (Linear prediction, vi t t t là LP) là m t ph n không th thi u c a h u

h t t t c gi i thu t mã hóa tho i hi n đ i ngày nay Ý t ng c b n là m t m u tho i có th đ c

x p x b ng m t k t h p tuy n tính c a các m u trong quá kh Trong m t khung tín hi u, các

tr ng s dùng đ tính toán k t h p tuy n tính đ c tìm b ng cách t i thi u hóa bình ph ng trung bình l i d đoán; các tr ng s t ng h p, ho c các h s d đoán tuy n tính (LPC) đ c dùng đ i

di n cho m t khung c th

Trong ph n ch ng 3, s s p x p LP theo h th ng d a trên mô hình ng c t đ ng Trong th c t , phân tích d là m t ti n trình c l ng đ tìm các thông s c a AR, mà các thông s này đ c cho b i các m u c a tín hi u Nh v y, LP là m t k thu t nh n d ng v i các thông s c a m t h th ng đ oc tìm t vi c quan sát V i gi đ nh là tín hi u tho i đ c mô hình nh là tín hi u AR, đi u này đã đ c ch ng minh tính đúng đ n c a nó trong th c ti n

M t cách bi u di n LP khác là ph ng pháp c l ng ph Nh đã trình bày trên, phân tích LP cho phép vi c tính toán các thông s c a AR, đã đ c đ nh ngh a trong m t đ ph công

su t (PSD) c a chính b n thân tín hi u B ng cách tính toán LPC c a m t khung tín hi u, ta có th

t o ra m t tín hi u khác theo cách th c có n i dung ph g n nh t ng đ ng v i tín hi u g c

LP c ng có th đ c xem nh là m t quá trình lo i b các d th a khi thông tin b l p l i trong m t s tr ng h p c n kh Sau cùng, vi c truy n d li u có th không c n thi t n u nh d

li u c n truy n có th đ c d đoán tr c B ng cách th c chuy n ch các d th a trong m t tín

hi u, s l ng bit c n thi t đ mang thông tin s ít h n và nh th s đ t đ c m c tiêu nén d

li u

Trong ph n này s đ c p đ n bài toán c b n c a phân tích LP đã đ c đ nh rõ, k t h p

v i vi c hi u ch nh l i cho phù h p theo h ng các tín hi u đ ng, c ng nh ví d và các gi i thu t

c n thi t cho quá trình d đoán tuy n tính

1.3.1.1 Bài toán d đoán tuy n tính

D đoán tuy n tính đ c mô t nh là m t bài toán nh n d ng h th ng, v i các thông s

c a m t mô hình AR đ c c l ng t b n thân tín hi u Mô hình đ c trình bày Hình 1.32 Tín hi u nhi u tr ng x [n] đ c l c b i quá trình t ng h p AR đ có đ c tín hi u AR s [n], v i các thông s AR đ c ký hi u là a i

^

D đoán tuy n tính th c hi n c đoán s [n] d a vào M

m u trong quá kh :

][]

[

1

^

i n s a n

M i i

d đoán đ c tính b ng công th c:

Trang 33

][][][n s n s n

[]

[

M i

i s n i a

n s E n e E

c t i thi u hóa b ng cách l a ch n LPC thích h p Thông s LPC t i u có th đ c tìm b ng cách thi t l p các đ o hàm riêng ph n c a Jkhi a iti n t i zero:

Trang 34

[2

s E a

i i k

][log

10log

2 10 2

2 10

n e E

n s E PG

Là t s gi a bi n tín hi u ngõ vào và bi n c a l i d đoán theo đ n v decibels (dB)

l i d đoán là thông s đo l ng ch t l ng c a b d đoán M t b d đoán t t h n có kh n ng

t nh dùng tín hi u nhi u tr ng đ t o ra tín hi u AR s [n] ây là tr ng h p t i u khi l i bình

ph ng trung bình đ c t i thi u hóa, v i

min E e [n] E x [n] x

Khi đó, đ l i d đoán đ t giá tr l n nh t

i u ki n t i u có th đ t đ c khi b c c a b d đoán l n h n ho c b ng b c c a quá trình t ng h p AR Trong th c t , M th ng là s ch a bi t tr c M t ph ng pháp đ n gi n đ

có th c l ng đ c giá tr M t tín hi u ngu n là v bi u đ đ l i d đoán nh là m t hàm

c a b c d đoán V i ph ng pháp này, ta có th quy t đ nh đ c b c c a d đoán ng v i đ l i bão hòa, khi đó khi t ng b c d đoán thì đ l i không t ng Giá tr c a b c d đoán t i đi m th a

đi u ki n bão hòa này đ c xem là giá tr c l ng t t nh t cho b c c a tín hi u AR

Sau khi đã xác đ nh đ c giá tr M, hàm chi phí Jđ t giá tr t i thi u khi a i a i

1.3.1.2 Phân tích d đoán tuy n tính cho tín hi u đ ng

Tín hi u tho i trong th c t là tín hi u đ ng, nên LPC ph i đ c tính ng v i t ng khung tín hi u Trong m t khung tín hi u, m t t p LPC đ c tính toán và dùng đ đ i di n cho các thu c tính c a tín hi u trong m t chu k c th , v i gi đ nh r ng s li u th ng kê c a tín hi u v n không thay đ i trong m t khung Quá trình tính toán LPC t d li u tín hi u đ c g i là phân tích

d đoán tuy n tính

Bài toán d đoán tuy n tính cho tín hi u đ ng đ c phát bi u l i nh sau: đây là bài toán

th c hi n vi c tính các giá tr LPC ng v i N đi m d li u v i th i gian k t thúc là m:

a m a m

Trang 35

m N m n

n e

n s m

PG

1 2 1 2

M i

6 =−

Khung t ng h p c a tín hi u AR đ c dùng cho phân tích LP, v i t ng c ng là 240 m u

c l ng t đ ng t ng quan không h i qui s d ng c a s Hamming Phân tích LP đ c th c

Trang 36

1.3.1.3 Gi i thu t Levison-Durbin

Thông th ng, vi c tính toán ma tr n ngh ch đ o không đ n gi n, tuy nhiên đ i v i bài toán này, các h s gi i thu t có th đ c tính thông qua tính toán ma tr n t ng quan Hai gi i thu t Levison-Durbin và Leroux-Gueguen là hai gi i thu t r t phù h p cho vi c tính toán LP c a các h th ng tri n khai trong th c t

Gi i thu t Levison-Durbin th c hi n vi c tìm b d đoán b c th M t b d đoán b c

th (M −1) ây là quá trình l p đ quy cho đ n khi tìm đ c l n đ u tiên b d đoán b c zero, sau đó s dùng b b c zero s đ c dùng đ tính b d đoán b c 1 và quá trình ti p t c cho đ n khi tính toán đ c b d đoán có b c c n tìm

Gi i thu t: bi n đ u vào là các h s t t ng quan R[ ]l , giá tr tính đ c là các LPC và

1

) 1 ( 1

i

l i l

l R l a R l i J

i k

;

) 1 ( ) 1 (

ng v i c s lý thuy t V n đ x y ra khi gi i thu t đ c áp d ng cho tính toán trên d u ch m

t nh Gi i thu t Leroux-Gueguen kh c ph c đi m y u này c a gi i thu t Levison-Durbin

Leroux và Gueguen [1979] đã đ xu t m t ph ng pháp tính toán các RC t các giá tr t

t ng quan mà không c n ph i tính thông qua các LPC Do đó, bài toán liên quan đ n t m đ ng

v i đi u ki n d u ch m t nh đã đ c gi i quy t Xét thông s sau

l

k i R a k

n s n e E k

0

) )

Trang 37

l

Sinh viên có th t ch ng minh

B ng 1.4 mô t các thông s εc n thi t ng v i m i b c ltrong gi i thu t Leroux-Gueguen

0,

) 1 (

l M k k l k k

l l

l =ε − − ε − − =− + + +

ε

o Gán l = l +1, quay l i b c 1

1.3.1.5 So sánh gi i thu t Levison-Durbin và Leroux-Gueguen

Gi i thu t Leroux-Gueguen phù h p h n cho các bài toán d u ch m t nh đ i v i các bi n trung gian có biên đã đ c bi t tr c Nh c đi m c a gi i thu t này là ch có các giá tr RC là

k t qu tr v , là k t qu không c n thi t đ i v i b l c l i i v ic các b l c có d ng tr c ti p, các giá tr LPC có th có đ c n u dùng m t trong hai gi i thu t

Vi c s d ng b l c m t cao th ng trong vi c tính toán LP th ng không đ n gi n do s

l ng tính toán Ngoài ra, đ i v i tr ng h p th i gian bi n đ i, các h s đ c c p nh t t khung

th i gian này đ n khung th i gian khác s làm cho vi c tính toán càng ph c t p h n đ i v i c u trúc l i Ngoài ra, ph ng pháp Leroux-Gueguen s d ng bi n đ i RC-sang-LPC không cung

c p vi c l u tr l i các b c tính toán quan tr ng so v i gi i thu t Levinson-Durbin T t c các

đi u trên làm cho gi i thu t Levinson-Durbin thông d ng h n trong th c ti n, đ c bi t là đ i v i

Trang 38

Trong các bài toán ng d ng th c t , gi i thu t Levison-Durbin dùng trong đi u ki n d u

ch m t nh ph i đ c cân nh c k sao cho đ m b o các bi n ph i n m trong t m v c cho phép

1.3.2 D đoán tuy n tính trong x lý tho i [13]

i v i vi c đ n gi n hóa mô hình x lý tho i, gi i thu t d đoán tuy n tính (LPC) là m t trong nh ng gi i thu t áp d ng t o các b mã hóa chu n cho vi c x lý âm ho t đ ng t n s

th p t c đ 2.4kbps, b mã hóa FS1015 LPC [Hãng Tremain, 1982] là m t b c ti n v t b t trong ngành x lý âm thanh; m c dù ch t l ng c a âm thanh đ c gi i mã không cao, nh ng h

th ng gi i mã đ n gi n và d hi u Thu t ng “mã hóa d đoán tuy n tính” xu t hi n t khi vi c

t o ra âm thanh tho i s d ng b t k gi i thu t ng d ng mô hình LPC, trong đó chu n FS1015 là chu n đi n hình

Ban đ u, trong vi c phát tri n cho vi c truy n thông b o m t thu c các ng d ng quân s ,

b mã hóa FS1015 đ c đ c tr ng b i tín hi u tho i mã t ng h p ngõ ra th ng c n đ n các nhân viên v n hành t ng đài đã đ c hu n luy n s d ng M c dù h u h t các b mã hóa tho i d a vào công ngh LP đ t đ c hi u su t cao h n ngày nay, nh ng v c b n, ho t đ ng c a chúng là có ngu n g c t LPC, vi c c i ti n nh m m c đích đ t đ c ch t l ng t t h n và hi u su t mã hóa

t i u h n

1.3.2.1 Mô hình x lý tín hi u tho i

Mô hình x lý tho i d a vào mô hình mã hóa d đoán tuy n tính đ c mô t trong Hình

1.35 Mô hình đ c d ng d a vào vi c quan sát các đ c tính c b n c a tín hi u tho i và b t

ch c k thu t t o âm thanh tho i c a ng i B l c t ng h p đ c mô ph ng theo s phát âm,

kh u âm c a mi ng ng i Tín hi u lái ngõ vào c a b l c ho c tín hi u kích thích m ch đ c mô

ph ng theo d ng xung truy n đ ng (âm thanh tho i) ho c là nhi u ng u nhiên (âm thanh phi tho i) Nh v y, ph thu c vào tr ng thái âm thanh tho i hay phi tho i c a tín hi u, m ch chuy n

đ c thi t l p v trí thích h p sao cho ngõ vào t ng ng s đ c ch n đ a vào m ch M c

n ng l ng c a tín hi u ngõ ra đwojc đi u khi n b i thông s đ l i

Làm cách nào mô hình phù h p v i ng c nh c a mã hóa âm tho i? Xét các m u tho i

m t cách riêng l ng v i t ng khung tín hi u không ch ng lên nhau ng v i t ng đo n khung

đ ng n, thu c tính c a tín hi u v c b n là h ng s Trong m i khung, các thông s c a mô hình

đ c c l ng t các m u tho i, các thông s bao g m:

̇ D ng: tín hi u thu c khung là tho i hay phi tho i

̇ l i: liên quan ch y u đ n m c n ng l ng c a khung

̇ H s l c: đ nh rõ đáp ng c a b l c t ng h p

̇ Chu k âm thanh: trong tr ng h p đ i v i khung tho i, là chi u dài th i gian gi a các xung kích thích liên ti p nhau

Quá trình c l ng thông s đ c th c hi n ng v i t ng m i khung, các k t qu chính

là các thông tin c a khung Nh v y, thay vì truy n các xung PCM, các thông s c a mô hình s

đ c g i đi Gi m gi m thi u nhi u và s méo tín hi u, các bít truy n đ c c p phát theo ch đ nh

ng v i t ng thông s , và t s nén t i u có th đ t đ c

Trang 39

Hình 1.35 Mô hình LPC t ng h p ti ng nói

Vi c c l ng các thông s là nhi m v c a b mã hóa B gi i mã s s d ng các thông

s c l ng này và dùng mô hình t o tho i đ t ng h p âm tho i

Hình 1.36 Hình v các các khung phi tho i

Hình 1.36 mô t m t khung tín hi u phi tho i có 180 m u (s d ng b mã hóa FS1015) Các m u nguyên th y đ c x phân tích LP qua quá trình t ng h p LPC dùng cho vi c t ng h p

âm tho i d a trên mô hình Hình 1.35 Tín hi u c a tín hi u nguyên th y và tín hi u sau khi t ng

h p có v gi ng nhau do m t đ ph c su t có d ng t ng đ ng, đ c mô t trong Hình 1.37

Trang 40

Hình 1.37 S đ c a m t khung âm thanh phi tho i, Hình bên trái: tín hi u nguyên thu ; Hình bên ph i: tín hi u t ng h p ng nét đ t là giá tr m t đ ph công su t dùng ph ng pháp d đoán LPC

Hình 1.38 S đ khung tín hi u âm thanh tho i Hình trên: tín hi u nguyên th y; Hình d i: tín

hi u t ng h p

Ngày đăng: 21/12/2022, 08:32

🧩 Sản phẩm bạn có thể quan tâm