H C VI N CÔNG NGH B U CHÍNH VI N THÔNG
X LÝ ÂM THANH, HÌNH NH
THS VÕ NGUY N QU C B O
Trang 3L I NÓI U
Tài li u h ng d n h c t p môn "X lý âm thanh và hình nh" dành cho kh i đào t o t
xa chuyên ngành đi n t vi n thông Tài li u này s gi i thi u nh ng ki n th c c b n v x lý âm thanh và hình nh c bi t, tác gi chú tr ng t i v n đ x lý tín hi u ng d ng trong m ng vi n thông: đó là các ph ng pháp nén tín hi u, l u tr , các tiêu chu n nén tín hi u âm thanh và hình
nh Nh ng ki n th c đ c trình bày trong tài li u s giúp h c viên ti p c n nhanh v i các v n đ
th c ti n th ng g p trong m ng vi n thông
Vì kh i l ng ki n th c trong l nh v c x lý âm thanh c ng nh hình nh r t l n, và v i
qu th i gian quá eo h p dành cho biên so n, tài li u h ng d n này ch a thâu tóm đ c toàn b
ki n th c c n có v l nh v c x lý âm thanh và hình nh tìm hi u v m t s v n đ có trong
đ c ng môn h c đòi h i h c viên ph i nghiên c u thêm trong s sách tham kh o đ c tác gi đ
c p t i trong ph n cu i c a tài li u này
N i dung cu n sách đ c chia làm hai ch ng:
M i ý ki n đóng góp đ ngh g i v theo đ a ch email: binhntptit@yahoo.com
Tp H Chí Minh 19/05/2007
Nhóm biên so n
Trang 5CH NG 1 K THU T X LÝ ÂM THANH
1.1 T NG QUAN V X LÝ ÂM THANH
1.1.1 Gi i thi u s l c v âm thanh & h th ng x lý âm thanh
1.1.1.1 c tính c a âm thanh t ng t [1]
M c đích c a l i nói là dùng đ truy n đ t thông tin Có r t nhi u cách mô t đ c đi m
c a vi c truy n đ t thông tin D a vào lý thuy t thông tin, l i nói có th đ c đ i di n b i thu t
ng là n i dung thông đi p, ho c là thông tin M t cách khác đ bi u th l i nói là tín hi u mang
n i dung thông đi p, nh là d ng sóng âm thanh
K thu t đ u tiên dùng trong vi c ghi âm s d ng các thông s v c , đi n c ng nh
tr ng có th làm nên nhi u cách th c ghi âm ng v i các lo i áp su t không khí khác nhau i n
áp đ n t m t microphone là tín hi u t ng t c a áp su t không khí (ho c đôi khi là v n t c) Dù
đ c phân tích b ng cách th c nào, thì các ph ng pháp khi so sánh v i nhau ph i dùng m t t l
th i gian
Trong khi các thi t b t ng t hi n đ i trông có v x lý âm thanh t t h n nh ng thi t b
c đi n, các tiêu chu n x lý thì h u nh không có gì thay đ i, m c dù công ngh có v x lý t t
h n Trong h th ng x lý âm thanh t ng t , thông tin đ c truy n đ t b ng thông s liên t c
bi n thiên vô h n
H th ng x lý âm thanh s lý t ng có nh ng tính n ng t ng t nh h th ng x lý âm thanh t ng t lý t ng: c hai ho t đ ng m t cách “trong su t” và t o l i d ng sóng ban đ u không l i Tuy nhiên, trong th gi i th c, các đi u ki n lý t ng r t hi m t n t i, cho nên hai lo i
h th ng x lý âm thanh ho t đ ng s khác nhau trong th c t Tín hi u s s truy n trong kho ng cách ng n h n tín hi u t ng t và v i chi phí th p h n Trong giáo trình này, t p trung đ c p
đ n h th ng s x lý âm thanh
Thông tin dùng đ truy n đ t c a âm tho i v b n ch t có tính r i r c [2], và nó có th
đ c bi u di n b i m t chu i ghép g m nhi u ph n t t m t t p h u h n các ký hi u (symbol) Các ký hi u t m i âm thanh có th đ c phân lo i thành các âm v (phoneme) M i ngôn ng có các t p âm v khác nhau, đ c đ c tr ng b i các con s có giá tr t 30 đ n 50 Ví d nh ti ng Anh đ c bi u di n b i m t t p kho ng 42 âm v
Tín hi u tho i đ c truy n v i t c đ nh th nào? i v i tín hi u âm tho i nguyên th y
ch a qua hi u ch nh thì t c đ truy n c l ng có th tính đ c b ng cách l u ý gi i h n v t lý
Trang 6m t âm v đ c bi u di n b i m t s nh phân, nh v y m t mã g m 6 bit có th bi u di n đ c
t t c các âm v c a ti ng Anh V i t c đ truy n trung bình 10 âm v /giây, và không quan tâm
đ n v n đ luy n âm gi a các âm v k nhau, ta có th c l ng đ c t c đ truy n trunh bình
c a âm tho i kho ng 60bit/giây
Trong h th ng truy n âm tho i, tín hi u tho i đ c truy n l u tr và x lý theo nhi u cách th c khác nhau Tuy nhiên đ i v i m i lo i h th ng x lý âm thanh thì có hai đi u c n quan tâm chung là:
1 Vi c duy trì n i dung c a thông đi p trong tín hi u tho i
2 Vi c bi u di n tín hi u tho i ph i đ t đ c m c tiêu ti n l i cho vi c truy n tin ho c l u
tr , ho c d ng linh đ ng cho vi c hi u ch nh tín hi u tho i sao cho không làm gi m nghiêm tr ng n i dung c a thông đi p tho i
Vi c bi u di n tín hi u tho i ph i đ m b o vi c các n i dung thông tin có th đ c d dàng trích ra b i ng i nghe, ho c b i các thi t b phân tích m t cách t đ ng
1.1.1.2 Khái ni m tín hi u
Là đ i l ng v t lý bi n thiên theo th i gian, theo không gian, theo m t ho c nhi u bi n
đ c l p khác, ví d nh :
Ü Âm thanh, ti ng nói: dao đ ng sóng theo th i gian (t)
Ü Hình nh: c ng đ sáng theo không gian (x, y, z)
Tín hi u đa chi u: bi n thiên theo nhi u h n m t bi n đ c l p, ví d nh tín hi u hình nh, tín hi u tivi tr ng đen
Tín hi u liên t c theo th i gian: là tín hi u đ c đ nh ngh a t i m i đi m trong đo n th i gian [a,b], ký hi u x (t)
Trang 7Hình 1.2 Tín hi u liên t c theo th i gian Tín hi u r i r c th i gian: là tín hi u ch đ c đ nh ngh a t i nh ng th i đi m r i r c khác nhau, ký hi u x (n)
Hình 1.3 Tín hi u r i r c theo th i gian Tín hi u liên t c giá tr : là tín hi u có th nh n tr b t k trong đo n [Ymin,Ymax], ví d tín
hi u t ng t (analog)
Hình 1.4 Tín hi u liên t c giá tr Tín hi u r i r c giá tr : tín hi u ch nh n tr trong m t t p tr r i r c đ nh tr c (tín hi u
s )
Trang 8Hình 1.5 Tín hi u r i r c giá tr Tín hi u analog: là tín hi u liên t c v th i gian, liên t c v giá tr
Hình 1.6 Tín hi u analog Tín hi u s : là tín hi u r i r c v th i gian, r i r c v giá tr
Tín hi u ng u nhiên: giá tr c a tín hi u trong t ng lai không th bi t tr c đ c Các tín
hi u trong t nhiên th ng thu c nhóm này
Tín hi u t t đ nh: giá tr tín hi u quá kh , hi n t i và t ng l i đ u đ c xác đ nh rõ, thông th ng có công th c xác đ nh rõ ràng
1.1.1.4 Phân lo i h th ng x lý
G m hai lo i h th ng là h th ng t ng t và h th ng s Trong đó h th ng x lý s : là
h th ng có th l p trình đ c, d mô ph ng, c u hình, s n xu t hàng lo t v i đ chính xác cao, giá thành h , tín hi u s d l u tr , v n chuy n và sao l u, nh c đi m là khó th c hi n v i các tín hi u có t n s cao
Trang 91.1.1.5 H th ng s x lý âm thanh [3]
nh y c a tai ng i r t cao, nó có th phân bi t đ c s l ng nhi u r t nh c ng nh
ch p nh n t m biên đ âm thanh r t l n Các đ c tính c a m t tín hi u tai ng i nghe đ c có th
đ c đo đ c b ng các công c phù h p Thông th ng, tai ng i nh y nh t t m t n s 2kHz và
c a tai ng i đ c phân tích và ng i ta nh n đ c k t qu là có d ng đáp ng logarith
Tín hi u âm thanh đ c truy n qua h th ng s là chu i các bit B i vì bit có tính ch tt r i
r c, d dàng xác đ nh s l ng b ng cách đ m s l ng trong m t giây, d dàng quy t đ nh t c đ truy n bit c n thi t đ truy n tín hi u mà không làm m t thông tin
Hình 1.8 nh n đ c tám m c tín hi u khác nhau m t cách phân bi t, tín hi u đ
nh-đ nh c a tín hi u nhi u ph i nh h n ho c nh-đ sai bi t gi a các m c nh-đ T s tín hi u trên nhi u
ph i t i thi u là 8:1 ho c là 18dB, truy n b i 3 bit 16 m c thì t s tín hi u trên nhi u ph i là 24dB, truy n b i 4 bit
1.1.1.6 Mô hình hóa tín hi u âm thanh [4]
Có r t nhi u k thu t x lý tín hi u đ c mô hình hóa và áp d ng các gi i thu t trong vi c khôi ph c âm thanh Ch t l ng c a âm tho i ph thu c r t l n vào mô hình gi đ nh phù h p v i
d li u i v i tín hi u âm thanh, bao g m âm tho i, nh c và nhi u không mong mu n, mô hình
ph i t ng quát và không sai l nh so v i gi đ nh M t đi u c n l u ý là h u h t các tín hi u âm tho i là các tín hi u đ ng trong th c t , m c dù mô hình th c ti n thì th ng gi đ nh khi phân tích tín hi u là tín hi u có tính ch t t nh trong m t kho ng th i gian đang xét
Mô hình phù h p v i h u h t r t nhi u lãnh v c trong vi c x lý chu i th i gian, bao g m
vi c ph c h i âm thanh là mô hình Autoregressive (vi t t t AR), đ c dùng làm mô hình chu n cho vi c phân tích d đoán tuy n tính
Trang 101
(1.1)
Mô hình AR đ i di n cho các quá trình tuy n tính t nh, ch p nh n tín hi u t ng t nhi u
và tín hi u t ng t đi u hòa M t mô hình khác phù h p h n đ i v i nhi u tình hu ng phân tích
là mô hình auto regressive moving-average (ARMA) cho phép các đi m c c c ng nh đi m 0 Tuy nhiên mô hình AR có tính linh đ ng h n trong phân tích h n mô hình ARMA, ví d m t tín
hi u nh c ph c t p c n mô hình có b c P>100 đ bi u di n d ng sóng c a tín hi u, trong khi các tín hi u đ n gi n h n ch c n bi u di n b ng b c 30 Trong nhi u ng d ng, vi c l a ch n b c
c a mô hình phù h p cho bài toán sao cho đ m b o vi c bi u di n tín hi u là th a vi c không làm
m t đi thông tin c a tín hi u là vi c h i ph c t p Có r t nhi u ph ng pháp dùng đ c l ng
ph ng pháp robust to noise [Huber, 1981, Spath, 1991], v.v… Tuy nhiên, đ i v i vi c x lý các
tín hi u âm nh c ph c t p thì thông th ng s d ng mô hình Sin (Sinusoidal) r t có hi u qu trong các ng d ng âm tho i Mô hình Sin r t phù h p trong các ph ng pháp dùng đ gi m nhi u Tín hi u đ c cho b i công th c sau
P i
i n t dt a
n s n
0 1
̇ K đ n, s d ng m t microphone đ thu tín hi u âm thanh (trong không khí) và chuy n
đ i thành tín hi u đi n, t m đi n áp ngõ ra c a microphone ±1 volt nh Hình 1.10
Trang 11Hình 1.10 D ng sóng c a tín hi u đi n
chuy n đ i t ng t -s (analog-to-digital converter) Khi s d ng b chuy n đ i 16bit
t ng t -s , t m s nguyên ngõ ra có giá tr –32,768 đ n +32,767, đ c mô t nh hình 1.11
Hình 1.11 Ngõ ra c a b chuy n đ i tín hi u t ng t sang tín hi u s
̇ Vì s l ng đi m d li u là vô h n nên không th l y t t c các đi m thu c tr c th i gian,
vi c l y m u s đ c th c hi n trong m t kho ng th i gian đ u đ n S l ng m u trong
m t giây đ c g i là t n s l y m u (sampling rate) Hình 1.12 mô t 43 m u đ c l y
Hình 1.12 Th c hi n vi c l y m u
̇ K t qu c a vi c l y m u là m t chu i g m 43 ch s bi u di n cho các v trí c a d ng sóng ng th i gian gian là m t chu k (hình 1.13)
Hình 1.13 K t qu c a vi c l y m u các giá tr
Trang 12Máy tính sau đó s xây d ng l i d ng sóng c a tín hi u b ng vi c k t n i các đi m d li u
B Hình dáng c a tín hi u tái t o ph thu c vào s l ng m u đ c ghi nh n
T ng quát, m t dãy s h u h n (đ i di n cho tín hi u s ) ch có th bi u di n cho m t
d ng sóng tín hi u t ng t v i đ chính xác h u h n
1.1.1.8 T n s l y m u
Khi chuy n đ i m t âm thanh sang d ng s , đi u c n l u ý là t n s l y m u c a h th ng
x lý ph i đ m b o tính trung th c và chính xác khi c n ph c h i l i d ng sóng tín hi u ban đ u
Theo đ nh l y m u Nyquist và Shannon, t n s l y m u quy t đ nh t n s cao nh t c a tín
hi u ph c h i tái t o l i d ng sóng có t n s là F, c n ph i l y 2F m u trong m t giây T n
s này còn đ c g i là t n s Nyquist Tuy nhiên, đ nh lý Nyquist không ph i là t i u cho m i
tr ng h p N u m t d ng sóng hình Sin có t n s là 500Hz, thì t n s l y m u 1000Hz N u nh
t n s l y m u cao h n t n s Nyquist s gây ra tình tr ng “hi u ng là” nh h ng đ n biên đ
c a tín hi u và tín hi u b c ng nhi u, tuy nhiên lúc đó thì các thành ph n hài t n s th p l i có tín
2
1)(
Bi n đ i z c a x (n) đ c đ nh ngh a b i bi u th c (1.6a) X (z) còn đ c g i là dãy công su t vô h n theo bi n z−1 v i các giá tr c a x (n) chính là các h s c a dãy công su t
Mi n h i t ROC là {z X (z) <∞}, là nh ng giá tr c a z sao cho chu i h i t , hay nói cách khác
Trang 13Ví d : Cho x(n)=δ(n−n0) Theo công th c (1.3a), ta có X(z)= z−n0
Ví d : Cho x(n)=u(n)−u(n−N) Theo công th c (1.3a), ta có
1 1
1)
1()
z X
N N
n
n
az z
a z
b z
πj C∫X W z −1d
)/()(2
1
1.1.2.2 Phép bi n đ i Fourier
Bi n đ i Fourier c a tín hi u r i r c th i gian đ c cho b i bi u th c
jwn n
jw
e n x e
1)
Trang 14= x n N n n
V i ~ n x( ) có th có d ng là t ng r i r c các tín hi u sin thay vì tích phân nh công th c
(1.9b) Phép bi n đ i Fourier cho chu i tu n hoàn nh sau
~)
(
~ N
n
kn N j
e n x k
~1)(
k
kn N j
e k X N k x
(
N n
n
z n x z
N u chia X (z) thành N đi m trên vòng tròn đ n v , j k N
k e
z = 2π , k=0,1, ,N −1, ta có:
)()
(
N n
kn N j k
N j
e n x e
X
π π
Trang 15Ta nh n th y r ng các m u ( )
2
k N j
e X
π
t ph ng trình (1.9a) và (1.11) chính là các h s Fourier c a chu i tu n hoàn ~ n x( ) trong ph ng trình (1.12) Nh v y, m t chu i có chi u dài N
có th đ c bi u diwnx b i phép bi n đ i Fourier r i r c (DFT) nh sau:
(
N n
kn N j
e n x k
1)(
N k
kn N j
e k X N n x
n x rN n x n
x
))((
()(
)(
=
=+
x(( + 0))
)(
0
2
k X
)(
N m
N
m n h m
)(
1 N r
N
r k W r X N
1.2 MÔ HÌNH X LÝ ÂM THANH
1.2.1.1 L y m u tín hi u mi n th i gian và tái t o tín hi u liên t c [6]
x lý m t tín hi u liên t c b ng các ph ng ti n x lý tín hi u s , ta ph i đ i tín hi u liên t c đó ra d ng m t chu i s b ng các l y m u tín hi u liên t c m t cách tu n hoàn có chu k
là T giây G i x (n) là tín hi u r i r c hình thành do quá trình l y m u, tín hi u liên t c x a (t), ta
có
)()(n x nT
Các m u x (n) ph i đ c l ng hóa thành m t t p các m c biên đ r i r c r i m i đ c
đ a vào b x lý s Hình 1.16 minh h a m t c u hình tiêu bi u cho h th ng x lý tín hi u t ng
Trang 16t b ng ph ng pháp s Trong các ph n sau, ta b qua sai s l ng hóa phát sinh trong quá trình
nh lý l y m u: m t tín hi u liên t c có b ng t n h u h n, có t n s cao nh t là B Hertz
có th khôi ph c t các m u c a nó v i đi u ki n t n s l y m u F s ≥2B m u / giây
1.2.1.2 L y m u tín hi u mi n t n s và tái t o tín hi u liên t c
Ta đã bi t tín hi u liên t c có n ng l ng h u h n thì có ph liên t c Trong ph n này, ta
s xét quá trình l y m u c a các tín hi u lo i đó m t cách tu n hoàn và s tái t o ín hi u t các
e n x
Gi s ta l y m u X(ω) tu n hoàn t i các đi m cách nhau ∂ω rad Vì X(ω) tu n hoàn
v i chu k 2π , ch có các m u trong ph m vi t n s c b n là c n thi t thu n ti n, ta l y N
m u cách đ u nhau trong kho ng 0≤ω ≤2π theo kho ng cách ∂ω =2π /N
e n x k
N
1, ,1,
k
N
X N n
0
)
2(
1)( ∑− π π
Trang 17T công th c x p (n) trên, ta nh n th y có th khôi ph c tín hi u x p (n) t các m u c a
ph X(ω) Nh v y, ta ph i tìm ra m i t ng quan gi a x p (n) và x (n) đ có th th c hi n khôi ph c x (n) t X(ω)
Vì x p (n) là s m r ng tu n hoàn c a x (n), nên x (n) có th đ c khôi ph c t x p (n)
n u không có aliasing cõi th i gian, ngh a là n u x (n) có th i gian gi i h n nh h n ho c b ng chu k N c a x p (n)
1.2.1.4 Các chu n mã hóa âm tho i trong các h th ng x lý tho i [7]
chuyên gia đã giành h t th i gian và tâm huy t th c hi n các công vi c ki m nghi m, mô ph ng sao cho đ m b o m t t p các yêu c u đ a ra đáp ng đ c Ch có các t ch c v i ngu n tài nguyên kh ng l m i có th th c hi n đ c các công vi c khó kh n này, thông th ng, th i gian
t i thi u c n thi t đ hoàn thành m t chu n trong tr ng h p g p nhi u thu n l i trong quá trình
là kho ng b n n m r i
i u này không có ngh a là m t chu n đ c đ a ra thì “không có l i” ho c không c n
ph i c i ti n Do đó, các chu n m i luôn luôn xu t hi n sao cho t t h n chu n c c ng nh phù
h p v i các ng d ng trong t ng lai
H i đ ng chu n là các t ch c có trách nhi m trong vi c giám sát vi c phát tri n các chu n cho m t ng d ng c th nào đó Sau đây là m t s h i đ ng chu n n i ti ng đ c nhi u nhà cung c p s n ph m tuân theo
chu n vi n thông c a ITU (chu n ITU-T) có uy tín trong vi c đ nh ra các chu n mã hóa
âm tho i cho h th ng m ng đi n tho i, bao g m các m ng vô tuy n l n h u tuy n
Ü Hi p h i công nghi p vi n thông - Telecommunications Industry Association (TIA): có trách nhi m ban hành các chu n mã hóa tho i cho các ng d ng c th , là m t thành viên
c a Vi n tiêu chu n qu c gia Hoa K - National Standards Institute (ANSI) TIA đã thành công trong vi c phát tri n các chu n s d ng trong các h th ng t ng đài t bào s B c
M , bao g m các h th ng s d ng chu n đa k t phân th i gian - Time division multiple access (TDMA) và a truy nh p phân chia theo mã - Code division multiple access (CDMA)
Ü Vi n tiêu chu n vi n thông châu Âu - European Telecommunications Standards Institute (ETSI): ETSI có các h i viên t các n c c ng nh các công ty Châu Âu, là t ch c đ a
ra các chu n s n xu t thi t b t i Châu Âu ETSI đ c thành l p b i nhóm có nh h ng
nh t trong lãnh v c mã hóa âm tho i là nhóm di đ ng đ c bi t - Groupe Speciale Mobile (GSM), đã đ a ra r t nhi u chu n h u d ng và đ c tri n khai r t nhi u trên th gi i
Ü B qu c phòng Hoa K - United States Department of Defense (DoD) DoD có liên quan
đ n vi c sáng l p các chu n mã hóa tho i, đ c bi t đ n v i các chu n liên bang Hoa K (U.S Federal) dùng nhi u cho các ng d ng quân s
Ü Trung tâm phát tri n và nghiên c u các h th ng vô tuy n c a Nh t B n - Research and Development Center for Radio Systems of Japan (RCR) Các chu n t bào s đ c phát hành b i RCR
Trang 18B ng 2.3 Các chu n mã hóa âm tho i chính
B c M
B c M
7.40, 6.70, 5.90, 5.15, 4.75
là đ c mô t ng n g n mà không có mô t k thu t chi ti t
1.2.1.5 Ki n trúc c a h th ng mã hóa âm tho i [8]
Hình 1.17 mô t s đ kh i c a h th ng mã hóa âm tho i Tín hi u âm tho i t ng t liên
t c có t ngu n cho tr c s đ c s hóa b i b m t b l c chu n, b l y m u (b chuy n đ i
th i gian r i r c), và b chuy n tín hi u t ng t sang tín hi u s Tín hi u ngõ ra là tín hi u âm tho i th i gian r i r c v i các giá tr l y m u c ng r i r c hóa Tín hi u này đ c xem là tín hi u
âm tho i s
Trang 19Hình 1.17 S đ kh i c a h th ng x lý tín hi u tho i
Thông th ng, h u h t các h th ng mã hóa âm tho i đ c thi t k đ h tr các ng d ng
vi n thông, v i t n s gi i h n gi a 300 và 3400Hz Theo lý thuy t Nyquist, t n s l y m u t i thi u ph i l n h n hai l n b ng thông c a tín hi u liên t c th i gian Giá tr 8kHz th ng đ c l a
ch n là t n s l y m u chu n cho tín hi u tho i B mã hóa kênh th c hi n vi c mã hóa hi u ch nh
l i c a chu i bit truy n tr c khi tín hi u đ c truy n trên kênh truy n, n i mà tín hi u s b thay
đ i do nhi u c ng nh giao thoa tín hi u… B gi i mã th c hi n vi c hi u ch nh l i đ có đ c tín hi u đã mã hóa, sau đó tín hi u đ c đ a vào b gi i mã đ có đ c tín hi u âm tho i s có cùng t c đ v i tín hi u ban đ u Lúc này, tín hi u s s đ c chuy n sang d ng t ng t th i gian liên t c B ph n th c hi n vi c x lý tín hi u tho i ch y u c a mô hình h th ng x lý tho i
là b mã hóa và gi i mã Thông th ng, khi x lý các bài toán v truy n tho i, mô hình đ c đ n
gi n hóa nh Hình 1.18
Ví d tín hi u tho i ngõ vào là tín hi u r i r c th i gian có t c đ bit là 128kbps đ c đ a vào b mã hóa đ th c hi n mã hóa chu i bit ho c th c hi n nén d li u tho i T c đ c a chu i bit thông th ng s có t c đ th p h n t c đ c a tín hi u ngõ vào b mã hóa B gi i mã nh n chu i bit mã hóa này và t o ra tín hi u tho i có d ng là r i r c th i gian và có t c đ b ng v i t c
đ c a tín hi u ban đ u truy n vào h th ng
Hình 1.18 S đ kh i đ n gi n hóa c a b mã hóa âm tho i
Trang 201.2.1.6 Ki n trúc t ng quát c a b mã hóa – gi i mã âm tho i [9]
Hình 1.19 Mô t s đ kh i t ng quát c a b mã hóa và gi i mã âm tho i
i v i b mã hóa, tín hi u âm tho i đ u vào đ c x lý và phân tích nh m thu đ c các thông s đ i di n cho m t khung truy n Các thông s ngày đ c mã hóa và l ng t v i mã ch
s nh phân và đ c g i đi nh là m t chu i bit đã đ c nén Các ch s này đ c đóng gói và
bi u di n thành chu i bit, chúng đ c s p x p th t truy n d a vào các thông s đã quy t đ nh
tr c và đ c truy n đ n b gi i mã
Hình 1.20 Mô hình chung c a b mã hóa âm tho i Hình trên: b mã hóa, hình d i: b
gi i mã
B gi i mã th c hi n vi c phân tích chu i bit nh n đ c, các ch s nh phân đ c ph c
h i sau quá trình phân tích và dùng đ k t h p v i các thông s t ng ng c a b gi i mã đ có
Trang 21đ c các thông s đã đ c l ng t Các thông s gi i mã này s k t h p v i nhau và đ c x lý
đ t o l i tín hi u âm tho i t ng h p
1.2.1.7 Các yêu c u c n có c a m t b mã hóa âm tho i [10]
M c tiêu chính c a c a mã hóa thoi là t i đa hóa ch t l ng nghe t i m t t c đ bit nào
đó, ho c t i thi u hóa t c đ bit ng v i m t ch t l ng đ c thù T c đ bit t ng ng v i âm tho i nào s đ c truy n ho c l u tr ph thu c vào chi phí c a vi c truy n hay l u tr , chi phí
c a mã hóa tín hi u tho i s , và các yêu c u v ch t l ng c a âm tho i đó Trong h u h t các b
mã hóa âm tho i, tín hi u đ c xây d ng l i s khác v i tín hi u nguyên th y T c đ bit truy n b
gi m b i vi c bi u di n tín hi u âm tho i (ho c các thông s trong mô hình t o âm tho i) v i đ chính xác b gi m, và b i quá trình lo i b các thông tin d th a c a tín hi u Các yêu c u lý
t ng c a m t b mã hóa tho i bao g m:
Ü T c đ bit th p: đ i v i chu i bit mã hóa có t c bit t l thu n v i b ng thông c n cho truy n d li u i u này d n đ n n u t c đ bit th p s làm t ng hi u su t c a h th ng Yêu c u này l i xung đ t v i các các đ c tính t t khác c a h th ng, nh là ch t l ng c a
âm tho i Trong th c t , vi c đánh đ i gi a các l a ch n ph thu c vào áp d ng vào ng
d ng gì
Ü Ch t l ng tho i cao: tín hi u âm tho i đã gi i mã ph i có ch t l ng có th ch p nh n
đ c đ i v i ng d ng c n đ t Có r t nhi u khía c nh v m t ch t l ng bao g m tính d
hi u, t nhiên, d nghe và c ng nh có th nh n d ng ng i nói
Ü Nh n d ng ti ng nói / ngôn ng khác nhau: k thu t nh n d ng ti ng nói có th phân bi t
đ c gi ng nói c a ng i l n nam gi i, ng i l n n gi i và tr con c ng nh nh n d ng
đ c ngôn ng nói c a ng i nói
Ü C ng đ m nh trong kênh truy n nhi u: đây là y u t quan tr ng đ i v i các h th ng truy n thông s v i các nhi u nh h ng m nh đ n ch t l ng c a tính hi u tho i
Ü Hi u su t cao đ i v i các tín hi u phi tho i (ví d nh tín hi u tone đi n tho i): trong h
th ng truy n d n kinh đi n, các tín hi u khác có th t n t i song song v i tín hi u âm tho i Các tín hi u tone nh là đa t n tone đôi – Dual tone multifrequency(DTMF) c a tín
hi u âm bàn phím và nh c thông th ng b chèn vào trong đ ng truy n tín hi u Ngay c
nh ng b mã hóa tho i t c đ th p c ng có th không th t o l i tín hi u m t cách hoàn
ch nh
Ü Kích th c b nh th p và đ ph c t p tính toán th p: nh m m c đích s d ng đ c b
mã hóa âm tho i trong th c t , chi phí th c hi n liên quan đ n vi c tri n khai h th ng
ph i th p, bao g m c vi c b nh càn thi t đ h tr khi h th ng ho t đ ng c ng nh các yêu c u tính toán Các nhà nghiên c u mã hóa âm tho i đã n l c trong vi c tìm ki m hi n
th c bài toán tri n khai trong th c ti n sao cho có hi u qu nh t
Ü tr mã hóa th p: trong quá trình x lý mã hóa và gi i mã tho i, đ tr tín hi u luôn luôn t n t i, chính là th i gian tr t gi a âm tho i ngõ vào c a b mã hóa v i tín hi u ngõ
ra c a b gi i mã Vi c tr quá m c s sinh ra nhi u v n đ trong vi c th c hi n trao đ i
ti ng nói hai chi u trong th i gian th c
1.2.2 Các mô hình dùng trong x lý âm thanh [11]
1.2.2.1 Mô hình quang ph
1.2.2.1.1 Mô hình sin
Trang 22Tín hi u âm thanh có th đ c tri n khai t t p h p các mô hình sin n u nh có có d ng
i e t A t
y
1
)
)()
y
1
cos)()
0
i nT
i
i n ω τ dτ φ
V c b n, n u nh I có giá tr vô cùng l n, thì b t c tín hi u âm thanh nào c ng có th
đ c tri n khai t mô hình sin, phép tính g n đúng đ c áp d ng tính toán trong mô hình này
Th c t , tính hi u nhi u c ng đ c tri n khai thành vô s các tín hi u sin, và ta tách vi c x lý
riêng tín hi u này thành ph n x lý Stochastic (Λ) đ c ký hi u là e (n)
( ) ( )+
i( )cosφ
)(
hình 1 Ph ng pháp này đ c ng d ng trong các ph n m m sms, vi t t t c a t ng h p mô hình
ph - spectral modeling synthesis
Hình 1.21 Phân tích các thành ph n hình sin c a ph n stochastic
Trang 23Phát hi n đ nh và ghép (Peak detection and continuation): đ th c hi n vi c phân tích
các thành ph n hình sin t tín hi u th ng d , ta ph i tìm đ c và ghi chú l i các đ nh t n s n i
tr i, t c là các thành ph n hình sin n m vai trò chính trong công th c phân tích đ c M t chi n thu t đ c s d ng đ th c hi n đi u này là v “b ng ch d n” trong các khung STFT
th c hi n vi c phân chia ph n nào là tín hi u, ph n nào là nhi u, các t n s và pha ph i
đ c xác đ nh m t cách chính xác Ngoài ra, đ quá trình t ng h p l i hai tín hi u đó đ c đ n
gi n, biên đ c a các thành ph n nên đ c n i suy gi a các khung tín hi u, và phép n i suy tuy n tính th ng đ c s d ng Các t n s c ng nh pha c a tín hi u c ng có th đ c n i suy, tuy nhiên c n ph i l u ý là phép n i suy t n s có nh h ng ch t ch đ n phép n i suy pha
T ng h p l i các thành ph n sin: Trong giai đo n t ng h p l i, các thành ph n sin có th
đ c t o b i b t k ph ng pháp nào nh máy t o dao đ ng s , máy t o dao đ ng b ng sóng ho c
t ng h p l y m u b ng sóng, ho c k thu t d a trên c s FFT K thu t FFT đ c s d ng nhi u
do tính ti n l i khi tín hi u có nhi u thành ph n hình sin
Trích tín hi u th ng d (Extraction of the residual): Vi c trích ph c a tín hi u nhi u
th ng d có th đ c th c hi n mi n t n (đ c mô t trong hình 1) ho c tr c ti p t mi n th i gian
S hi u ch nh ph th ng d (Residual spectral fitting): thành ph n stochastic đ c mô hình hóa là tín hi u nhi u b ng r ng, đ c l c b i kh i đ c tr ng tuy n tính Ph c ng đ c a tín
hi u th ng d có th đ c x p x b ng giá tr trung bình c a hàm piecewise-linear Vi c t ng h p trong mi n th i gian có th đ c th c hi n b ng phép đ o FFT, sau khi đã n đ nh đ c m t t p
c ng đ mong mu n và m t t p pha ng u nhiên
Hi u ch nh âm thanh: mô hình sin là m t mô hình h u d ng vì nó cho phép áp d ng vi c
truy n các âm thanh nh c l y t vi c ghi b ng th c t Hình 1.22 mô t m t các b c th c h ên cho vi c hi u ch nh tín hi u âm nh c
Hình 1.22 C c u t ch c cho vi c bi u di n vi c truy n tín hi u âm nh c
1.2.2.1.2 Tín hi u sin + nhi u + n t đ m
Trong mô hình sin + nhi u, đi u c b n là các tín hi u âm thanh là t ng h p c a nhi u tín
hi u sin t n s th p và các lo i nhi u b ng r ng h u nh d ng t nh Khi đó, m t thành ph n c a
âm thanh không đ c xem xét đ n, đó là n t đ m Vi c hi u ch nh âm thanh có th đ c th c
Trang 24hi n d dàng b ng cách tách riêng thành ph n n t đ m đ xét riêng Th c t , h u h t các d ng c
âm nh c m r ng tr ng đ c a m t n t nh c không làm nh h ng đ n ch t l ng x lý
V i lý do này, m t mô hình m i là sin + nhi u + n t đ m đ c phát h a dùng trong vi c phân tích âm thanh Ý t ng chính c a vi c trích âm đ m trong th c t t vi c quan sát r ng, các tín hi u hình sin trong mi n th i gian đ c ánh x qua mi n t n thành các đ nh có v trí xác đ nh, trong khi đó các xung ng n đ i ng u trong mi n th i gian khi đ c ánh x qua mi n t n l i có
d ng hình sin Nh v y, mô hình sin có th đ c ng d ng trong mi n t n s bi u di n các tín
hi u hình sin S đ c a vi c phân tích SNT đ c mô t trong Hình 1.23
Hình 1.23 Phân tích tín hi u âm thanh theo mô hình sin + nhi u + n t đ m
Kh i DCT trong Hình 1.23 mô t ho t đ ng c a phép r i r c cosin
(
N
k n n
x k
(1.24)
Phép bi n đ i DCT th c hi n vi c m t xung đ c bi n đ i thành d ng cosin và ng c l i
1.2.2.1.3 Mô hình LPC
Mã hóa d đoán tuy n tính có th đ c s d ng đ mô hình ph t nh T ng h p LPC đ c
mô t trong l u đ trong Hình 1.24 V b n ch t, mô hình chính là gi i thu t tr t ng h p th c
hi n m t tính hi u có ph “đ c” đ c l c b i m t b l c c c Tín hi u kích thích có th s d ng chính tín hi u th ng d e có đ c qua quá trình phân tích, ho c có th d d ng các thông tin c a tín hi u tho i/phi tho i
1.2.2.2 Mô hình mi n th i gian
Vi c mô t âm thanh trong mi n t n r t có hi u qu , tuy nhiên trong m t vài ng d ng, đ
ti n vi c nghiên c u vi c t ng h p âm thanh, vi c phân tích trong mi n th i gian l i có u th h n
Trang 251.2.2.2.1 Máy t o dao đ ng s
Ta nh n th y m t âm thanh ph c t p đu c t ng h p t nhi u thành ph n hình sin b ng
phép t ng h p FTT-1 N u nh các thành ph n hình sin không quá nhi u, vi c t ng h p t ng thành
ph n đ c th c hi n b ng cách l y giá tr trung bình c a máy t o dao đ ng s
n j j n
j
e e
)(cos)(sin)1(n 0x n 0x n
áp ng xung c a b l c nh sau
0 1
1
1cos
21
1)
−
= − − −j z j z
R
e e
z z z
Giá tr c c c a b l c bi u th c 10 n m trên chu vi đ ng tròn đ n v
G i x R1, x R2 là hai bi n tr ng thái c a hai m u tr oc đó c a tín hi u ngõ ra x R, pha ban
Máy t o dao đ ng s đ c bi t h u ích trong vi c bi u di n t ng h p tín hi u đ i v i các b
vi x lý đa m c đích, khi các phép toán trên d u ch m đ ng đ c tri n khai Tuy nhiên, ph ng
pháp này dùng cho vi c t o tín hi u sin có hai b t l i:
̇ Vi c c p nh t thông s yêu c u tính toán trên hàm cosin ây là m t đi u khó đ i v i
đi u ch t c đ âm thanh, do ph i th c hi n phép tính cosin ng v i t ng m u trong
mi n th i gian
̇ Thay đ i t n s c a máy dao đ ng s s làm thay đ i biên đ tín hi u sin Khi đó b
ph n logic đi u khi n biên đ c n đ c s d ng đ đi u ch nh h n ch này
1.2.2.2.2 Máy t o dao đ ng b ng sóng
Trong ph ng pháp kinh đi n và linh đ ng nh t v t ng h p các d ng sóng có chu k (bao
g m tín hi u d ng sin) là vi c đ c l p đi l p l i m t b ng ch a n i dung c a m t d ng sóng đã
đ c l u tr tr c N u d ng sóng đ c t ng h p d ng sin, đ i x ng thì vi c l u tr cho phép
ch c n l u tr ¼ chu k , và vi c tính toán s h c s đ c n i suy cho c chu k
t buf[ ] là b đ m có n i dung ch a là chu k c a d ng sóng, ho c b ng d ng sóng
Máy t o dao đ ng d ng sóng ho t đ ng l p l i theo chu k quét b ng d ng sóng là b i s c a gia
s I và đ c n i dung c a b ng d ng sóng t i v trí đó
Trang 26G i B là chi u dài c a b đ m, f0 là t n s mà ta mu n t o t n s l y m u F s, khi đó giá
F
s
s =
1 ,
2 ,
Hình 1.26 Ví d v thay đ i t n s l y m u v i L/M =3/2
1.2.2.2.3 T ng h p l y m u b ng sóng
T ng h p l y m u b ng sóng là ph n m r ng c a máy dao đ ng b ng sóng đ i v i
Trang 27• D ng sóng phân tích không ph i d ng sin
• B ng d ng sóng đ c l u tr v i nhi u chu k
Các tín hi u đi u khi n r t quan tr ng trong vi c nh n đ c âm thanh t nhiên
1.2.2.2.4 T ng h p h t (v i Giovanni De Poli)
Các b ng sóng ng n có th đ c đ c v i nhi u t c đ khác nhau, và k t qu là âm đi u có
th ch ng chéo vào nhau trong mi n th i gian Trong ph ng pháp mi n th i gian, vi c t ng h p
âm thanh này đ c g i là t ng h p h t T ng h p h t b t đ u t ý t ng vi c phân tích âm thanh
trong mi n th i gian đ c thay th b ng bi u di n chúng thành m t chu i các thành ph n ng n
đ c g i là “h t” Các thông s c a k thu t này là các d ng sóng c a h t th g k(⋅), v trí trong
g n a g n l
Khi s l ng “h t” l n, thì vi c tính toán s tr nên ph c t p Tính ch t c a các h t và các
v trí trong mi n th i gian quy t đ nh âm s c c a âm thanh Vi c l a ch n các thông s tùy thu c
vào các tiêu chu n đ a ra b i các mô hình th hi n Vi c l a ch n các mô hình bi u di n liên quan
đ n các quá trình ho t đ ng mà các quá trình này có th nh h ng đ n âm thanh nào đó theo
K thu t t ng h p phi tuy n thông d ng nh t là đi u t n (FM) Trong liên l c thông tin,
FM đ c dùng trong các th p k g n đây, nh ng ng d ng c a nó trong gi i thu t t ng h p âm
thanh trong mi n th i gian r i r c đ c bi t đ n v i cái tên John Chowning V b n ch t,
Chowning đã th c hi n các nghiên c u trên các ph m vi khác nhau c a vi c t o ti ng rung b ng
các b t o dao đ ng đ n gi n, và thu đ c k t qu là các t n s rung nhanh s t o ra các thay đ i
đ y k ch tính Nh v y, đi u ch t n s c a m t máy t o dao đ ng c ng đ t o ra tín hi u âm
thanh có ph ph c t p Mô hình FM c a Chowning nh sau:
( n I n ) A ( n ( )n )
A n
V i ωc là t n s sóng mang và ωm là t n s đi u ch , I là ch s đi u ch Ph ng trình
Hình 1.27 mô t vi c tri n khai pd c a gi i thu t FM đ n gi n T n s đi u ch đ c
dùng đ đi u khi n tr c ti p b t o dao đ ng, trong khi t n s sóng mang dùng đ đi u khi n b
Trang 28t o pha đ n v , t o pha theo chu k V i t n s sóng mang, t n s đi u ch và ch s đi u ch cho
tr c, ta có th d dàng d đoán các thành ph n ph t n s c a âm thanh k t qu
Hình 1.27 Ph n tri n khai phân ph i pd c a đi u pha
Vi c phân tích d a trên đ c tính l ng giác
k
m c k
m c k
carrier c
m c
n k n
k I
J n
I
J
A
n I
n A
)
(
ω ω ω
ω ω
ω ω
(1.38)
V i J k (I) là b c th k c a hàm Bessel Các hàm Bessel đ c v trên hình 9 ng v i nhi u giá tr k trên tr c s l ng side-frequencies và giá tr I trên tr c ch s đi u ch
Hình 1.28 Các giá tr c a hàm Bessel
Trang 29B ng thông có giá tr x p x b ng
1.2.2.3.2 Méo phi tuy n
Khái ni m t ng h p âm thanh b ng méo phi tuy n – Nonlinear distortion (NLD) r t đ n
gi n: ngõ ra c a m ch t o dao đ ng đ c dùng nh là thông s c a m t hàm phi tuy n Trong
mi n th i gian r i r c s , hàm phi tuy n đ c l u tr trong m t b ng, và ngõ ra c a b dao đ ng
đ c dùng nh là ch s đ truy nh p vào b ng i u thú v c a NLD là lý thuy t này cho phép
thi t k m t b ng méo cho b i các đ c đi m k thu t c a m t ph mong mu n
N u b t o dao đ ng có d ng tín hi u sin, ta có th tính toán NLD nh sau
)cos(
)(n A 0n
( ) (x n )
F n
V i hàm s phi tuy n, dùng đa th c Chebyshev a th c Chebyshev c p đ n đ c đ nh
ngh a đ quy nh sau:
1)(
0 x =
x x
)()
(2)(x xT 1 x T 2 x
Nh v y, v i tính ch t (31), n u hàm méo phi tuy n là đa th c Chebyshev c p đ m, giá
tr ngõ ra y có đ c b ng cách s d ng b dao đ ng sin x(n)=cosω0n, nh v y
k T x h x
Ngoài các mô hình trên, các mô hình v t lý c ng đ c áp d ng trong vi c t ng h p, x lý
âm thanh nh m ch dao đ ng v t lý, m ch dao đ ng đôi và m ch phân ph i c ng h ng m t
chi u
1.2.3 Mô hình th i gian r i r c [12]
Trong h u h t các tr ng h p liên quan đ n x lý thông tin, vi c bi u di n tín hi u sao
cho đ m b o tính ti n l i trong phân tích mà v n không làm m t đi tính ch t c a tín hi u là đi u
mà các nhà khoa h c quan tâm Sóng âm thanh xu t phát t l i nói c a ng i có tính ch t t nhiên
và ng u nhiên nh t Phân tích toán h c thu n ti n nh t là xem sóng âm thanh là m t hàm s theo
bi n th i gian t Ta ký hi u x a (t) là d ng sóng t ng t theo th i gian t
Trang 30Hình 1.29 Bi u di n tín hi u âm tho i
Trong giáo trình này, ta dùng ký hi u x (n) mô t cho chu i s Trong tr ng h p l y
m u tín hi u âm tho i, m t chu i có th đ c xem nh là m t dãy các m u c a tín hi u t ng t
đ c l y m u m t cách đ u đ n v i th i gian l y m u là T, khi đó tín hi u sau khi l y m u đ c
ký hi u b i x a (nT) Hình 1.1 mô t m t ví d c a vi c tín hi u âm tho i đ c bi u di n c hai
d ng là tín hi u t ng t và d ng chu i các m u đ c l y m u t n s là 8kHz
Xung đ n v đ c đ nh ngh a nh sau:
1)(n =
δ n=0
Chu i b c đ n v đ c ký hi u
1)(n =
)(n r e 0 r 0n j 0n
Trang 31Hình 1.30 (a) L y m u đ n v , (b) đ n v b c, (c) hàm m th c và (d) hàm sin suy gi m
Hình 1.31 S đ kh i (a) h th ng đ n ngõ vào/đ n ngõ ra; (b) h th ng đ n ngõ vào/đa ngõ ra
Khi h th ng g m nhi u ngõ ra, tín hi u chu i ngõ ra s đ c bi u di n b ng m t vector
đ c mô t nh Hình 1.31
H th ng tuy n tính d ch b t bi n là h th ng đ c bi t h u d ng cho vi c x lý tín hi u âm tho i H th ng đ c đ c tr ng b i đáp ng xung, h (n), khi đó tín hi u ngõ ra đ c tính b i công th c
Trang 32v i * là phép ch p hai tín hi u
1.3 LÝ THUY T VÀ CÁC BÀI TOÁN C B N
1.3.1 Phân tích d đoán tuy n tính [12]
D đoán tuy n tính (Linear prediction, vi t t t là LP) là m t ph n không th thi u c a h u
h t t t c gi i thu t mã hóa tho i hi n đ i ngày nay Ý t ng c b n là m t m u tho i có th đ c
x p x b ng m t k t h p tuy n tính c a các m u trong quá kh Trong m t khung tín hi u, các
tr ng s dùng đ tính toán k t h p tuy n tính đ c tìm b ng cách t i thi u hóa bình ph ng trung bình l i d đoán; các tr ng s t ng h p, ho c các h s d đoán tuy n tính (LPC) đ c dùng đ i
di n cho m t khung c th
Trong ph n ch ng 3, s s p x p LP theo h th ng d a trên mô hình ng c t đ ng Trong th c t , phân tích d là m t ti n trình c l ng đ tìm các thông s c a AR, mà các thông s này đ c cho b i các m u c a tín hi u Nh v y, LP là m t k thu t nh n d ng v i các thông s c a m t h th ng đ oc tìm t vi c quan sát V i gi đ nh là tín hi u tho i đ c mô hình nh là tín hi u AR, đi u này đã đ c ch ng minh tính đúng đ n c a nó trong th c ti n
M t cách bi u di n LP khác là ph ng pháp c l ng ph Nh đã trình bày trên, phân tích LP cho phép vi c tính toán các thông s c a AR, đã đ c đ nh ngh a trong m t đ ph công
su t (PSD) c a chính b n thân tín hi u B ng cách tính toán LPC c a m t khung tín hi u, ta có th
t o ra m t tín hi u khác theo cách th c có n i dung ph g n nh t ng đ ng v i tín hi u g c
LP c ng có th đ c xem nh là m t quá trình lo i b các d th a khi thông tin b l p l i trong m t s tr ng h p c n kh Sau cùng, vi c truy n d li u có th không c n thi t n u nh d
li u c n truy n có th đ c d đoán tr c B ng cách th c chuy n ch các d th a trong m t tín
hi u, s l ng bit c n thi t đ mang thông tin s ít h n và nh th s đ t đ c m c tiêu nén d
li u
Trong ph n này s đ c p đ n bài toán c b n c a phân tích LP đã đ c đ nh rõ, k t h p
v i vi c hi u ch nh l i cho phù h p theo h ng các tín hi u đ ng, c ng nh ví d và các gi i thu t
c n thi t cho quá trình d đoán tuy n tính
1.3.1.1 Bài toán d đoán tuy n tính
D đoán tuy n tính đ c mô t nh là m t bài toán nh n d ng h th ng, v i các thông s
c a m t mô hình AR đ c c l ng t b n thân tín hi u Mô hình đ c trình bày Hình 1.32 Tín hi u nhi u tr ng x [n] đ c l c b i quá trình t ng h p AR đ có đ c tín hi u AR s [n], v i các thông s AR đ c ký hi u là a i
^
D đoán tuy n tính th c hi n c đoán s [n] d a vào M
m u trong quá kh :
][]
[
1
^
i n s a n
M i i
d đoán đ c tính b ng công th c:
Trang 33][][][n s n s n
[]
[
M i
i s n i a
n s E n e E
c t i thi u hóa b ng cách l a ch n LPC thích h p Thông s LPC t i u có th đ c tìm b ng cách thi t l p các đ o hàm riêng ph n c a Jkhi a iti n t i zero:
Trang 34[2
s E a
i i k
][log
10log
2 10 2
2 10
n e E
n s E PG
Là t s gi a bi n tín hi u ngõ vào và bi n c a l i d đoán theo đ n v decibels (dB)
l i d đoán là thông s đo l ng ch t l ng c a b d đoán M t b d đoán t t h n có kh n ng
t nh dùng tín hi u nhi u tr ng đ t o ra tín hi u AR s [n] ây là tr ng h p t i u khi l i bình
ph ng trung bình đ c t i thi u hóa, v i
min E e [n] E x [n] x
Khi đó, đ l i d đoán đ t giá tr l n nh t
i u ki n t i u có th đ t đ c khi b c c a b d đoán l n h n ho c b ng b c c a quá trình t ng h p AR Trong th c t , M th ng là s ch a bi t tr c M t ph ng pháp đ n gi n đ
có th c l ng đ c giá tr M t tín hi u ngu n là v bi u đ đ l i d đoán nh là m t hàm
c a b c d đoán V i ph ng pháp này, ta có th quy t đ nh đ c b c c a d đoán ng v i đ l i bão hòa, khi đó khi t ng b c d đoán thì đ l i không t ng Giá tr c a b c d đoán t i đi m th a
đi u ki n bão hòa này đ c xem là giá tr c l ng t t nh t cho b c c a tín hi u AR
Sau khi đã xác đ nh đ c giá tr M, hàm chi phí Jđ t giá tr t i thi u khi a i a i
1.3.1.2 Phân tích d đoán tuy n tính cho tín hi u đ ng
Tín hi u tho i trong th c t là tín hi u đ ng, nên LPC ph i đ c tính ng v i t ng khung tín hi u Trong m t khung tín hi u, m t t p LPC đ c tính toán và dùng đ đ i di n cho các thu c tính c a tín hi u trong m t chu k c th , v i gi đ nh r ng s li u th ng kê c a tín hi u v n không thay đ i trong m t khung Quá trình tính toán LPC t d li u tín hi u đ c g i là phân tích
d đoán tuy n tính
Bài toán d đoán tuy n tính cho tín hi u đ ng đ c phát bi u l i nh sau: đây là bài toán
th c hi n vi c tính các giá tr LPC ng v i N đi m d li u v i th i gian k t thúc là m:
a m a m
Trang 35m N m n
n e
n s m
PG
1 2 1 2
M i
6 =−
Khung t ng h p c a tín hi u AR đ c dùng cho phân tích LP, v i t ng c ng là 240 m u
c l ng t đ ng t ng quan không h i qui s d ng c a s Hamming Phân tích LP đ c th c
Trang 361.3.1.3 Gi i thu t Levison-Durbin
Thông th ng, vi c tính toán ma tr n ngh ch đ o không đ n gi n, tuy nhiên đ i v i bài toán này, các h s gi i thu t có th đ c tính thông qua tính toán ma tr n t ng quan Hai gi i thu t Levison-Durbin và Leroux-Gueguen là hai gi i thu t r t phù h p cho vi c tính toán LP c a các h th ng tri n khai trong th c t
Gi i thu t Levison-Durbin th c hi n vi c tìm b d đoán b c th M t b d đoán b c
th (M −1) ây là quá trình l p đ quy cho đ n khi tìm đ c l n đ u tiên b d đoán b c zero, sau đó s dùng b b c zero s đ c dùng đ tính b d đoán b c 1 và quá trình ti p t c cho đ n khi tính toán đ c b d đoán có b c c n tìm
Gi i thu t: bi n đ u vào là các h s t t ng quan R[ ]l , giá tr tính đ c là các LPC và
1
) 1 ( 1
i
l i l
l R l a R l i J
i k
;
) 1 ( ) 1 (
ng v i c s lý thuy t V n đ x y ra khi gi i thu t đ c áp d ng cho tính toán trên d u ch m
t nh Gi i thu t Leroux-Gueguen kh c ph c đi m y u này c a gi i thu t Levison-Durbin
Leroux và Gueguen [1979] đã đ xu t m t ph ng pháp tính toán các RC t các giá tr t
t ng quan mà không c n ph i tính thông qua các LPC Do đó, bài toán liên quan đ n t m đ ng
v i đi u ki n d u ch m t nh đã đ c gi i quy t Xét thông s sau
l
k i R a k
n s n e E k
0
) )
Trang 37l ≤
Sinh viên có th t ch ng minh
B ng 1.4 mô t các thông s εc n thi t ng v i m i b c ltrong gi i thu t Leroux-Gueguen
0,
) 1 (
l M k k l k k
l l
l =ε − − ε − − =− + + +
ε
o Gán l = l +1, quay l i b c 1
1.3.1.5 So sánh gi i thu t Levison-Durbin và Leroux-Gueguen
Gi i thu t Leroux-Gueguen phù h p h n cho các bài toán d u ch m t nh đ i v i các bi n trung gian có biên đã đ c bi t tr c Nh c đi m c a gi i thu t này là ch có các giá tr RC là
k t qu tr v , là k t qu không c n thi t đ i v i b l c l i i v ic các b l c có d ng tr c ti p, các giá tr LPC có th có đ c n u dùng m t trong hai gi i thu t
Vi c s d ng b l c m t cao th ng trong vi c tính toán LP th ng không đ n gi n do s
l ng tính toán Ngoài ra, đ i v i tr ng h p th i gian bi n đ i, các h s đ c c p nh t t khung
th i gian này đ n khung th i gian khác s làm cho vi c tính toán càng ph c t p h n đ i v i c u trúc l i Ngoài ra, ph ng pháp Leroux-Gueguen s d ng bi n đ i RC-sang-LPC không cung
c p vi c l u tr l i các b c tính toán quan tr ng so v i gi i thu t Levinson-Durbin T t c các
đi u trên làm cho gi i thu t Levinson-Durbin thông d ng h n trong th c ti n, đ c bi t là đ i v i
Trang 38Trong các bài toán ng d ng th c t , gi i thu t Levison-Durbin dùng trong đi u ki n d u
ch m t nh ph i đ c cân nh c k sao cho đ m b o các bi n ph i n m trong t m v c cho phép
1.3.2 D đoán tuy n tính trong x lý tho i [13]
i v i vi c đ n gi n hóa mô hình x lý tho i, gi i thu t d đoán tuy n tính (LPC) là m t trong nh ng gi i thu t áp d ng t o các b mã hóa chu n cho vi c x lý âm ho t đ ng t n s
th p t c đ 2.4kbps, b mã hóa FS1015 LPC [Hãng Tremain, 1982] là m t b c ti n v t b t trong ngành x lý âm thanh; m c dù ch t l ng c a âm thanh đ c gi i mã không cao, nh ng h
th ng gi i mã đ n gi n và d hi u Thu t ng “mã hóa d đoán tuy n tính” xu t hi n t khi vi c
t o ra âm thanh tho i s d ng b t k gi i thu t ng d ng mô hình LPC, trong đó chu n FS1015 là chu n đi n hình
Ban đ u, trong vi c phát tri n cho vi c truy n thông b o m t thu c các ng d ng quân s ,
b mã hóa FS1015 đ c đ c tr ng b i tín hi u tho i mã t ng h p ngõ ra th ng c n đ n các nhân viên v n hành t ng đài đã đ c hu n luy n s d ng M c dù h u h t các b mã hóa tho i d a vào công ngh LP đ t đ c hi u su t cao h n ngày nay, nh ng v c b n, ho t đ ng c a chúng là có ngu n g c t LPC, vi c c i ti n nh m m c đích đ t đ c ch t l ng t t h n và hi u su t mã hóa
t i u h n
1.3.2.1 Mô hình x lý tín hi u tho i
Mô hình x lý tho i d a vào mô hình mã hóa d đoán tuy n tính đ c mô t trong Hình
1.35 Mô hình đ c d ng d a vào vi c quan sát các đ c tính c b n c a tín hi u tho i và b t
ch c k thu t t o âm thanh tho i c a ng i B l c t ng h p đ c mô ph ng theo s phát âm,
kh u âm c a mi ng ng i Tín hi u lái ngõ vào c a b l c ho c tín hi u kích thích m ch đ c mô
ph ng theo d ng xung truy n đ ng (âm thanh tho i) ho c là nhi u ng u nhiên (âm thanh phi tho i) Nh v y, ph thu c vào tr ng thái âm thanh tho i hay phi tho i c a tín hi u, m ch chuy n
đ c thi t l p v trí thích h p sao cho ngõ vào t ng ng s đ c ch n đ a vào m ch M c
n ng l ng c a tín hi u ngõ ra đwojc đi u khi n b i thông s đ l i
Làm cách nào mô hình phù h p v i ng c nh c a mã hóa âm tho i? Xét các m u tho i
m t cách riêng l ng v i t ng khung tín hi u không ch ng lên nhau ng v i t ng đo n khung
đ ng n, thu c tính c a tín hi u v c b n là h ng s Trong m i khung, các thông s c a mô hình
đ c c l ng t các m u tho i, các thông s bao g m:
̇ D ng: tín hi u thu c khung là tho i hay phi tho i
̇ l i: liên quan ch y u đ n m c n ng l ng c a khung
̇ H s l c: đ nh rõ đáp ng c a b l c t ng h p
̇ Chu k âm thanh: trong tr ng h p đ i v i khung tho i, là chi u dài th i gian gi a các xung kích thích liên ti p nhau
Quá trình c l ng thông s đ c th c hi n ng v i t ng m i khung, các k t qu chính
là các thông tin c a khung Nh v y, thay vì truy n các xung PCM, các thông s c a mô hình s
đ c g i đi Gi m gi m thi u nhi u và s méo tín hi u, các bít truy n đ c c p phát theo ch đ nh
ng v i t ng thông s , và t s nén t i u có th đ t đ c
Trang 39Hình 1.35 Mô hình LPC t ng h p ti ng nói
Vi c c l ng các thông s là nhi m v c a b mã hóa B gi i mã s s d ng các thông
s c l ng này và dùng mô hình t o tho i đ t ng h p âm tho i
Hình 1.36 Hình v các các khung phi tho i
Hình 1.36 mô t m t khung tín hi u phi tho i có 180 m u (s d ng b mã hóa FS1015) Các m u nguyên th y đ c x phân tích LP qua quá trình t ng h p LPC dùng cho vi c t ng h p
âm tho i d a trên mô hình Hình 1.35 Tín hi u c a tín hi u nguyên th y và tín hi u sau khi t ng
h p có v gi ng nhau do m t đ ph c su t có d ng t ng đ ng, đ c mô t trong Hình 1.37
Trang 40Hình 1.37 S đ c a m t khung âm thanh phi tho i, Hình bên trái: tín hi u nguyên thu ; Hình bên ph i: tín hi u t ng h p ng nét đ t là giá tr m t đ ph công su t dùng ph ng pháp d đoán LPC
Hình 1.38 S đ khung tín hi u âm thanh tho i Hình trên: tín hi u nguyên th y; Hình d i: tín
hi u t ng h p