White-noise generator Impulse-train generator + Transversal filter Voiced or unvoiced Amplifier gain Synthesized peech xk Analyzer + Encoder ek + _ Parameters ξq k LPC signal... Predicti
Trang 1Ch ng 6.
THU T TOÁN CS-ACELP C A G.729 ITU-T
6.1 LPC t ng h p ti ng nói
Mã d báo tuy n tính LCP (Linear Predictive Coding) là m t ph ng pháp m i và khác hoàn toàn v i các ph ng pháp PCM, DPCM, và ADPCM đ tái hi n b ng s các tín hi u t ng t Ph ng pháp này dùng b l c ngang (hay các m ch s
t ng đ ng) c ng các thành ph n ph đ t ng h p d ng sóng theo yêu c u Các tham s c a d ng sóng t ng h p đ c s hóa đ truy n đi thay vì tín hi u th c s Xét hi u qu các k t qu n u quá trình t ng h p chính xác hoàn toàn v i ti n trình
t ng t Vì đã có các thông s v ti ng nói, LCP đ c bi t thích h p v i t ng h p
ti ng nói và t o ti ng nói.
Hình 6.1 T ng h p ti ng nói
Hình 6.1 mô t m t quá trình t ng h p ti ng nói bao g m hai ngu n phát đ u vào, m t b khu ch đ i thay đ i đ l i, và m t b l c ngang trong vòng h i ti p
l i c a b khu ch đ i và b l c t ng nhánh đ c đi u ch nh đ đ nh d ng tính ch t
âm thanh (di n đ t) trên dãi âm t n Nh ng ti ng không có âm đ c t o b ng n i
v i ngu n phát nhi u tr ng Nh ng ti ng có âm đ c n i vào các ngu n phát dãy xung đ n v i các t n s thích h p v i các cao đ
N u b l c có kho ng 10 nhánh đ l i, và các tham s đ c thu th p kho ng 10
đ n 25ms, quá trình t ng h p ti ng nói r t d dàng m c dù có th nó h i gi t o.
White-noise
generator
Impulse-train
generator
+
Transversal filter Voiced or
unvoiced
Amplifier gain
Synthesized peech
x(k)
Analyzer
+ Encoder
e(k) +
_
Parameters
ξq (k)
LPC signal
Trang 2Hình 6.2 H th ng phát LPC - m ch phát
Hình 6.3 H th ng phát LPC -m ch thu
Xét h th ng phát LPC nh hình 6.2 Các giá tr m u c a ti ng nói đ u vào đ c phân tích đ tìm ra các tham s t ng h p, toàn b các giá tr ra so sánh v i đ u vào Các k t qu sai khác đ c mã hoá theo các giá tr tham s t tín hi u s đ c truy n B thu trong hình 6.3 dùng các giá tr tham s và sai s l ng t đ tái t o
l i d ng sóng âm thanh
T mã LPC hoàn ch nh có kho ng 80 bit – 1 bit đ chuy n đ i tr ng h p có âm
và không có âm, 6 bit cho cao đ , 5 bit cho đ l i khu ch đ i, 6 bit cho t ng đ l i
c a 10 nhánh, và m t vài bit phát hi n l i Ghi nh n các tham s m i 10-25ms
t ng đ ng l y m u t n s 40-100hz, vì th LPC đòi h i t c đ bit kho ng 3000-8000bps Vi c gi m đáng k t c đ bit làm cho LPC có kh n ng thay th trong n l c c i ti n ch t l ng c a t ng h p ti ng nói cho truy n thông tho i.
6.2 Khuy n ngh G.729
ITU-T đã phát hành khuy n ngh G.729 vào n m 1996, đ c bi t đ n nh m t b
mã hoá ti ng nói ch t l ng cao, đ tr th p và t c đ 8 Kbps Thu t toán đ c d a trên k thu t mã hoá d báo tuy n tính kích thích theo mã hình h c đ i s - c u trúc
ph c h p CS-ACELP (Conjugate Structure-Algebraic Code Excited Linear
Decoder
Synthesizer
+
LPC
Trang 3Prediction) và s d ng các khung ti ng nói 10ms Codec phân ph i ti ng nói ch t
l ng th c (toll-quality)(t ng đ ng v i 32 Kbps ADPCM) cho h u h t các đi u
ki n ho t đ ng
Ch ng này này s di n t các khía c nh quan tr ng c a thu t toán và m c đích
c a ch ng này là tìm hi u s mã vector l ng t hoá vector đ c thi t k và
hu n luy n ra sao và làm quen v i các tính n ng c a c u trúc CS-ACELP.
6.3 Thu t toán CS-ACELP
Thu t toán CS-ACELP đ c đ a ra b i khuy n ngh G.729 S đ kh i đ c ch ra trong hình 6.4
Hình 6.4 S đ kh i G.729
B mã hoá (coder) này d a trên m t ki u mã hoá CELP và s d ng m t k thu t
t ng h p phân tích xác đ nh các vector đ t o kích thích t t nh t mà làm gi m thi u
s méo tr ng s c m giác gi a ti ng nói ban đ u và ti ng nói t o ra b ng ph ng pháp t ng h p.
Phân tích d báo tuy n tính LP (linear prediction analysis) đ c th c hi n tr c tiên, và tín hi u ti ng nói đ c đ c bi u di n b ng các h s d báo tuy n tính
Trang 4LPC (linear prediction coefficient) đã đ c tính toán Các h s LPC đã l ng t hoá đ c s d ng trong b l c t ng h p (synthesis filter) c a coder này S kích thích c a b l c này bao g m hai ph n: m t là vector s mã thích ng(adaptive codebook vector) nh m tái t o c u trúc di n đ t c a âm thanh gi ng nói, và hai là vector s mã c đ nh(fixed codebook vector) nh m tái t o âm thanh câm Hai vector
s mã đã chia t l b i nh ng đ l i (gain) riêng c a chúng đ xây d ng s kích thích c a b l c t ng h p (synthesis filter) Ti ng nói đã t ng h p đ c t o và có
đ méo t i thi u liên quan đ n ti ng nói g c, và các vector s mã đã tìm là nh ng cái t t nh t.
Thông th ng, s ph c t p tính toán cho CELP là khá l n, nh t là khi tìm ki m kích thích t t nh t B i v y, thu t toán CS-ACELP s d ng các k thu t mã hoá và
c u trúc s mã đ c bi t ó là, h t nhân c a thu t toán là nh sau: phân tích LP và
l ng t hoá LSP (line spectrum pair) s d ng l ng t hoá vector VQ (vector quantization) v i d báo trung bình đ ng liên khung (inter-frame moving average (MA) prediction); tìm ki m di n đ t v i các chi n l c hai t ng bao g m phân tích chu k đóng (open-loop) và chu k m (closed-loop); c u trúc đ i s c a s mã c
đ nh làm đ n gi n hoá th t c tìm ki m c a nó; và c u trúc ph c h p c a các đ
l i (c hai cho s mã thích ng và s mã c đ nh) s mã VQ, mà c ng có th t o
s đ n gi n hóa có th b i vi c áp d ng m t th t c ch n l a tr c(pre-selection procedure).
6.3.1 Phân tích LP & L ng t hoá LSP
Tr c tiên, phân tích d báo tuy n tính LP (linear prediction) đ c th c hi n m i
l n cho m i khung 10ms Quá trình này đ c ch ra hình 6.5.
Hình 6.5 Phân tích LP.
đây, m t c a s b t đ i x ng (asymmetric window) đ c bi t dài 240 đ c s
d ng làm c a s phân tích LP C a s đ c đ a ra b i công th c sau đây, mà áp
d ng cho 120 m u t khung ti ng nói tr c, 80 m u t khung hi n hành, và 40
m u t khung t ng lai.
Trang 5Ti ng nói đã qua c a s s(n) đ c s d ng đ tính toán các h s LPC LPC thu
đ c sau đó đ c chuy n đ i sang các c p ph v ch LSP (Line Spectrum Pair) cho m c đích VQ, vì các tham s LSP t ng ng liên quan đ n khuôn m u c a hình bao ph ti ng nói, và mô t tr c ti p đ nh ph ng n k Nh th , các sai s
c a tham s trên t n s nào đó ch nh h ng ph ti ng nói xung quanh đi m t n
s này và có nh h ng m t ít trên các t n s khác Trong khi các h s LCP không có s liên quan t ng ng nh th , các tham s LSP có th làm t ng hi u
qu vector đ c l ng t hoá và n i suy m t cách t ng đ i Theo các thu c tính
c m giác đ c bi t c a thích giác con ng i, các tham s LSP có quan h v i s phân ph i t n s nh y c m đ c c p phát nhi u bit h n, trong khi các tham s s khác t ng ng v i s phân ph i t n s ít nh y c m đ c c p phát ít bit đ gi m
t ng s bit mã hoá.
N u đ chính xác c a l ng t hoá LSP không v a đ , ch t l ng c a ti ng nói
gi i mã s gi m đáng k Nh th m t s mã c l n đ c c n đ n, và s ph c t p tìm ki m và các bit t ng lên đ ng th i Trong xem xét trên, m t VQ hai t ng v i
d báo MA th t chuy n m ch l n th t (switched 4th order MA prediction) đ c
s d ng đ gi m c s mã và đ ph c t p v i vi c c p phát bit ít h n T ng th
nh t s d ng m t VQ 10-chi u v i 7 bit, và t ng hai là m t VQ tách 10-bit v i hai
s mã 5-chi u H n n a, 1 bit đ c phân ph i cho s l a ch n các h s d báo MA.
6.3.2 Tìm s mã thích ng và di n đ t
Coder đ a đ n nhi u ph c t p trong tính toán, đ c bi t khi tìm ki m s mã thích
ng (di n đ t) và s mã c đ nh V i m c đích đ n gi n hoá, m t l i vào (approach) hai t ng đ c đ a ra trong tìm ki m s mã thích ng và các th t c
đ c ch ra trong hình 6.6.
Hình 6.6 Phân tích s di n đ t (tính ch t âm thanh).
t ng th nh t, phân tích chu k m đ c c l ng m i l n cho t ng khung 10ms M c dù s tìm ki m là đ n gi n và tr di n đ t c l ng đ t đ c là r t thô, th t c là thi t y u đ thu h p ph m vi tìm ki m và đ n gi n h n nhi u s
ph c t p khi tìm di n đ t.
Trang 6Nh th đ ng biên c a chu k đóng tìm ki m di n đ t đ c gi i h n Xung quanh
tr di n đ t chu k m , phân tích chu k đóng đ c th c hi n cho m i khung con (sub-frame) 5ms v i phân gi i 1/3 trong kho ng 19
3
1
÷ 84
3
2
và s nguyên duy
nh t trong kho ng 85 ÷ 143 Và tr t i u đ c xác đ nh b i t i thi u hoá trung bình bình ph ng sai s tr ng s gi a ti ng nói g c và ti ng khôi ph c i u này
đ t đ c b i c c đ i hoá s h ng sau:
v i x(n) là tín hi u đích, và y k (n) là kích thích l c t i tr k yk(n) xo n đ c tính cho
tr tmin Cho nh ng đ tr nguyên khác trong kho ng tìm ki m k = t min + 1,…, tmax,
nó đ c c p nh t s d ng quan h đ quy:
v i h(n) là đáp ng xung c a b l c t ng h p tr ng s (weighted synthesis filter) Các tham s s mã thích ng là các ch s (index) t ng ng v i tr và đ l i nào
đó Trong l i vào s mã thích ng đ th c thi b l c di n đ t, kích thích đ c l p
đ các tr ít h n đ dài khung con(sub-frame) Vi c s d ng các tr bé t o cho quá trình x lý này tr giá đ c tính toán trong quá trình tìm t ng Do đó, kích thích v t quá kho ng th i gian di n đ t đ c kéo dài b i ph n d LP trong quá trình tìm
ki m Th t c này là đ n gi n h n, và cho th y nó t o ra các k t qu gi ng nhau sau khi so v i vi c s d ng s mã thích ng cho t ng khung đ y đ (complete frame) M i khi tr đã đ c xác đ nh, l i vào s mã thích ng quy c đ c s
d ng đ k t sinh vector s mã thích ng.
6.3.3 Tìm s mã c đ nh
M t s mã đ i s đ c bi t v i 17 bit đ c s d ng cho kích thích s mã c đ nh, các vector c a nó có 40 chi u.
S mã s d ng m t cách s p x p hoán v xung đ n cài xen ISSP (interleaved single-pulse permutation), và t đó m i vector ch a b n xung khác 0 (nonzero pulse) v i các biên đ ±1 trên các v trí đ c th a nh n ch ra trong b ng trên hình 6.7.
Trang 7Hình 6.7 B ng c u trúc c a s mã c đ nh.
Tìm ki m s mã c đ nh c ng đ c th c hi n trên m i sub-frame và d i công
th c đo sai s tr ng s trung bình bình ph ng N u C k là vector s mã c đ nh
th k, thì vector t t nh t đ c tìm ki m b i vi c tìm th y biên đ và v trí b n xung không 0 c a nó mà c c đ i hoá phân s sau:
v i t bi u th hoán v , d(n) là tín hi u t ng quan c a tín hi u đích h(n), và là ma
tr n liên quan đ n h(n).
C u trúc đ i s c a s mã c đ nh cho phép th t c tìm ki m nhanh h n, đ n gi n,
và b nh nh h ng ít h n Ngoài ra, tr c khi tìm tín hi u d(n) đ c tách ra làm hai ph n: giá tr tuy t đ i c a nó và d u c a nó đ t trên biên đ c a xung trên cùng
v trí Sau đó các công th c liên quan khác đ c ch nh s a đ phù h p v i quá trình đ n gi n hoá Và m t chi n l c t p trung đ c s d ng đ đ n gi n hoá
h n n a b i thi t l p m t ng ng tính tr c và m t liên k t đi u khi n tr c khi vào tìm ki m chu k sau cùng.
5.3.4 L ng t hoá vector c a các đ l i
K ti p là các đ l i VQ cho đóng góp s mã thích ng và c đ nh v i 7 bit, và d báo MA đ c áp d ng v i đ l i s mã c đ nh L ng t hoá n i chung này cung
c p m t s ti t ki m kho ng 2 bit so v i l ng t hoá vô h ng D a trên nh ng
so sánh không chính th c, cho th y r ng l ng t hoá này không đ a ra b t k
gi m sút đáng k c a ch t l ng ti ng nói so v i các đ l i không l ng t hoá.
l i s mã thích ng và h s hi u ch nh c a đ l i s mã c đ nh đ c l ng t hoá vector S mã VQ s d ng m t c u trúc liên h p hai t ng M i t ng bao g m
s mã 2-chi u và t ng đ u tiên s d ng s mã GA v i 3 bit, và t ng hai bao g m
m t s mã GB 4-bit Thành ph n đ u tiên c a t ng vector trong m i s mã mô t
đ l i s mã thích ng đã l ng t hoá, và thành ph n th hai mô t h s hi u
ch nh đ l i s mã c đ nh đã l ng t hoá.
C u trúc đ c bi t có th làm đ n gi n tìm ki m s mã b ng cách áp d ng m t th
t c ch n l a tr c T c hai s mã, m t n a ch s tham d t t nh t đ c ch n
l a tr c tiên S mã GA có 8 vector, v i thành ph n th hai th ng l n h n thành ph n th nh t, trong khi 16 vector t s mã GB có hoàn c nh ng c l i Trong th t c ch n tr c, b n vector v i các thành ph n th hai g n v i đ l i s
mã c đ nh h n đ c l a ch n t s mã t ng th nh t; và 8 vector đ c l a ch n
t s mã t ng th hai, các thành ph n th nh t g n v i đ l i s mã thích ng
h n.
Có th th y đ c sau khi ch n l a tr c, s l ng thành ph n tham d nh h n nhi u và đ ph c t p c ng gi m xu ng Sau đó trong kho ng nh h n, nó tìm t
h p t t nh t c a hai ch m c t i thi u hoá sai s tr ng s trung bình bình ph ng.
Trang 9K T LU N
L u l ng d li u đã ph i b t bu c theo truy n th ng đ thích h p v i các m ng tho i (thí d , s d ng modem) Internet t o ra m t c h i đ thay đ i hoàn toàn chi n l c tích h p này - tho i và fax ngày nay có th đ c truy n qua các m ng IP,
v i s tích h p video và các ng d ng đa ph ng ti n theo sát nó Internet và b giao th c TCP/IP c b n c a nó tr thành đ ng l c cho các công ngh m i, v i
nh ng th thách duy nh t v tho i th i gian th c tr thành công ngh sau cùng trong chu i nh ng s phát tri n
M c dù tiêu chu n H.323 đ c so n th o cho thi t b multimedia đ u cu i c a m ng LAN, song tiêu chu n này l i là n n t ng cho vi c phát tri n các s n ph m đi n tho i
IP Thi t b đ u cu i, Gateway, Gatekeeper và MCU là thành ph n chính t o nên
m ng cung c p d ch v tho i qua Internet Thành ph n m ng Gateway đóng vai trò trung gian trong vi c h tr cu c g i gi a thuê bao m ng IP và thuê bao m ng chuy n m ch kênh Hai ch c n ng chính c a Gateway là chuy n đ i th t c báo
hi u và chuy n đ i các ph ng pháp nén tín thông tin (ti ng nói, video và s li u)
gi a hai m ng M t thành ph n m ng quan tr ng đang đ c các nhà s n xu t quan tâm đó là Gatekeeper Ch c n ng c a Gatekeeper bao g m d ch đ a ch gi a m ng
IP và m ng chuy n m ch kênh, đi u khi n quy n truy nh p m ng, thay đ i b ng thông c a k t n i và qu n lý vùng mà thuê bao đ ng ký
Quá trình báo hi u và x lý cu c g i theo khuy n ngh H.323 liên quan đ n 3 kênh báo hi u g m kênh đi u khi n H.245, kênh báo hi u RAS, kênh báo hi u H.225 Kênh RAS dùng đ truy n các b n tin H.225 RAS gi a gatekeeper v i các thành
ph n khác trong m ng nh m th c hi n m t s th t c nh đ ng ký, đ nh v đi m
cu i, giám sát tr ng thái, thay đ i b ng thông Kênh báo hi u H.225 s d ng các
b n tin báo hi u trong khuy n ngh H.225 đ thi t l p, gi i phóng cu c g i Các b n tin này có th đ c đ nh tuy n tr c ti p gi a hai đi m cu i tham gia cu c g i ho c qua gatekeeper mà các đi m cu i này đ ng ký Kênh đi u khi n H.245 truy n các
b n tin H.245 đ th c hi n các th t c nh trao đ i kh n ng, xác đ nh ch t , đóng
m kênh logic Cu c g i b t đ u trên 2 kênh báo hi u H.225 m t chi u Sau khi trao đ i các b n tin báo hi u, đ a ch kênh đi u khi n s đ c xác đ nh và kênh đi u khi n đ c thi t l p M i cu c g i ch thi t l p duy nh t m t kênh đi u khi n Các
b n tin H.245 đ c s d ng đ th c hi n th t c m kênh thông tin media cho phép hai bên đàm tho i Ngoài ra, H.323 còn đ a ra th t c k t n i nhanh và th t c mã hoá b n tin H.245 trong b n tin báo hi u H.225, b qua giai đo n thi t l p kênh đi u khi n Các th t c này s không cung c p đ y đ các ch c n ng nh m t kênh H.245, nh ng chúng đ c u tiên s d ng trong d ch v tho i IP vì mang l i hi u
qu cao h n
Khi cu c g i có s tham gia c a m ng SCN, báo hi u gi a gateway và m ng SCN là báo hi u trong m ng SCN Báo hi u gi a gateway v i đ u cu i ho c gateway trong
m ng IP tuân theo khuy n ngh H.323 Tiêu chu n k thu t TS 101 322 và TS 101
471 gi i h n nh ng th t c b n tin H.323 đ c áp d ng trong đi n tho i IP Trong giai đo n thi t l p và gi i phóng cu c g i, các thông tin báo hi u trong b ng c a
Trang 10SCN s đ c truy n trong các b n tin báo hi u H.225 Trong giai đo n th c hi n
cu c g i, chúng s đ c truy n trong b n tin H.245 userInputIndication.
Th tr ng đ các s n ph m VoIP đ c thi t l p và đang b t đ u giai đo n phát tri n nhanh chóng c a nó Các nhà s n xu t trong th tr ng này ph i tìm các cách đ c i
ti n gi i pháp c a h n u h mu n tr thành nh ng nhà s n xu t d n đ u th tr ng
Vi c mua và tích h p ph n m m đã xác đ nh tr c và ki m tra tr c thay cho m i
th đang xây d ng tùy thích là m t trong nh ng tu ch n
Cisco System là nhà s n xu t hàng đ u trong vi c áp d ng các chu n công nghi p VoIP trong các thi t b c a mình Thi t b Cisco AS5400 là gateway tho i và d li u
có th tin c y, tính quy mô và nhi u tính n ng Cisco AS5400 h tr đ y đ báo hi u PSTN (SS7/C7, CAS, RPI, R2), báo hi u gateway (H.323, SIP, MGCP), các codec tho i, fax, Voice XML, RADIUS, TCL và IVR Cisco AS5400 c ng cung c p tính
m m d o đ nâng c p h th ng trong t ng lai
Cisco AS5400 h tr t t c các nhà cung c p d ch v các ng quay s và tho i nh :
• Liên l c đi n tho i đ ng dài
• Cu c g i tr tr c
• Truy nh p n i b
• i n tho i IP Hosting
• ASP Hosting và Termination
• Liên l c h p nh t
• Truy c p quay s
khai thác t t các thi t b gateway Cisco AS5400 và tài nguyên m ng, nhân viên
k thu t ph i n m b t k thu t v n hành và th c hi n các l nh c u hình d ch v V i giao ti p dòng-l nh CLI (command-line interface), ph n m m Cisco IOS có trong thi t b Cisco AS5400 v i hàng ngàn l nh h tr nhân viên k thu t có th c u hình tùy thích đ thi t b này ho t đ ng phù h p v i th c t m ng l i
Tho i qua IP không th t o ra nh ng tho hi p trong ch t l ng tho i, tính tin c y, tính quy mô, và kh n ng qu n lý Nó c ng ph i nh h ng l n nhau không biên
gi i v i các h th ng đi n tho i trên toàn th gi i H u nh t t c các thi t b m ng ngày nay s c n có kh n ng tho i và cu i cùng là kh n ng đa ph ng ti n Nh ng
kh n ng m r ng trong t ng lai s có c nh ng gi i pháp sáng ki n m i bao g m
c u n i h i tho i, đ ng b tho i/d li u, nh ng d ch v k t h p th i gian th c và trên c s b n tin, chuy n đ i v n b n sang ti ng nói và các h th ng tr l i tho i